Промпт-хаки вроде «чаевых» теряют эффективность; исследования SSRN 2025 года показывают, что даже «цепочка рассуждений» слабеет, что говорит о зрелости современных БЯМ и требует новых подходов к взаимодействию.
Современные методы промпт-инжиниринга, включая chain-of-thought, теряют свою эффективность в новых моделях искусственного интеллекта. Это ...
by A Gao · 2023 · Cited by 69 — The goal of this article is to introduce practical and validated prompt engineering techniques to a non-technical audience.
For prompt hacking, there are several subtypes: prompt injection with jailbreaking and prompt leaking. Generic prompt-level adversarial attacks.
Эпоха, когда элементарные словесные трюки, такие как обещания «чаевых» или заявления о «угрожаемой карьере», могли существенно улучшить производительность больших языковых моделей (БЯМ), подходит к завершению. Набор недавних академических исследований указывает, что эти уже ставшие классическими хаки промпт-инжиниринга теряют свою эффективность в современных версиях ИИ. Более того, даже более продвинутый метод, известный как «цепочка рассуждений» (chain-of-thought prompting), демонстрирует сниженное полезное воздействие на моделях, изначально не созданных для логических выводов.
Эксперты в области машинного обучения и крупное ИТ-сообщество на протяжении многих лет опирались на разнообразные эвристики для повышения качества ответов, генерируемых моделями. Среди них находились так называемые «хаки», опирающиеся на социально-психологические триггеры, а также более систематичные подходы, такие как chain-of-thought prompting. Этот метод подразумевает, что модель должна открыто формировать промежуточные шаги рассуждения перед тем, как представить финальный ответ. Он оказался особенно эффективен для reasoning models, однако, согласно последним данным, его полезность снижается при работе с non-reasoning models, разработанными без акцента на пошаговую логику.
Это вывод подтверждается несколькими исследованиями, размещёнными на платформе Social Science Research Network (SSRN). В частности, три публикации - «The End of Prompt Engineering?», «Are Simple Behavioral Prompts Still Effective? Evidence From Large Language Models» и «The Unpredictable Effectiveness of Prompt Engineering in Large Language Models» - тщательного разбирают современное состояние промпт-инжиниринга. Данные работы, последние из которых обновлены в 2025 году, предоставляют эмпирические свидетельства того, что:
Эти заключения также нашли отражение в комментариях специалистов, например, в посте Итана Моллика (Ethan Mollick) от 2025-08-04, где он отметил, что «хаки промпт-инжиниринга, видимо, перестали функционировать с современными моделями» (ссылка на X.com).
Уменьшение эффективности традиционных подходов к промпт-инжинирингу поднимает несколько ключевых вопросов перед исследователями и разработчиками:
Эти тенденции свидетельствуют о зрелости технологий ИИ. Если в прошлом можно было достичь заметного прогресса посредством относительно простых текстовых правок, то ныне требуется более профессиональный и менее интуитивный подход. Это подразумевает, что будущее промпт-инжиниринга, скорее всего, будет сопряжено с внедрением более сложных алгоритмических методов либо с более глубоким пониманием фундаментальных архитектур БЯМ.
Современные методы промпт-инжиниринга, включая chain-of-thought, теряют свою эффективность в новых моделях искусственного интеллекта. Это ...
by A Gao · 2023 · Cited by 69 — The goal of this article is to introduce practical and validated prompt engineering techniques to a non-technical audience.
For prompt hacking, there are several subtypes: prompt injection with jailbreaking and prompt leaking. Generic prompt-level adversarial attacks.
Вопросы и ответы