7 августа 2025 года OpenAI представила GPT-5, новое семейство масштабных языковых моделей. Внутренние тесты компаний и независимые бенчмарки демонстрируют улучшение производительности по сравнению с GPT-4o и конкурентами, особенно в кодинге и финансовом анализе, при этом модель позиционируется как "очень дешевая".
Модель GPT-5 Pro заняла первое место среди всех проверенных frontier-LLM на закрытом бенчмарке ARC-AGI Semi-Private. Тесте, оценивающем ...
Многоэтапные сложные сборки. Возможные потоки планирования. Мы сравним: Качество вывода. Скорость сборки. Эффективность отладки.
Performance has more than doubled from GPT‑4o (released spring 2024) to GPT‑5 (released summer 2025), following a clear linear trend. In ...
Consistency: GPT-5 was highly consistent. Gemini was also stable in detection and severity, but varied more in CWE mapping. Claude was ...
Дебаты вокруг анонса GPT-5 от OpenAI накаляются с новой силой, находясь между утверждениями о революционной эффективности и скепсисом пользователей Reddit, уже выразивших недовольство. На фоне этого информационного шума возникает вопрос: может ли GPT-5 быть лишь очередным итеративным улучшением, или же это действительно прорыв, меняющий правила игры? Фактические данные и независимые бенчмарки проливают свет на эту проблему, показывая сложную картину заметных улучшений в ряде ключевых областей, но также подчёркивая сохраняющиеся нюансы в восприятии пользователями.
7 августа 2025 года OpenAI официально представила GPT-5 как новое семейство масштабных языковых моделей, отличающихся «инженерной устойчивостью, мультифункциональностью и управляемостью». В это семейство входят gpt-5-main (стандартная), gpt-5-main-mini (упрощённая), gpt-5-thinking («размышляющая»), gpt-5-thinking-pro (ускоренная для рассуждений) и gpt-5-thinking-nano (компактная для разработчиков). Ключевым элементом архитектуры является встроенный роутер, который автоматически выбирает наиболее подходящую модель для каждого запроса, стремясь оптимизировать производительность и эффективность.
Компании, внедряющие искусственный интеллект в свои продукты, сообщают о заметных повышениях при использовании GPT-5 в сравнении с предыдущими моделями и конкурентами. Эти сведения, полученные из внутренних тестов, дают представление о практической применимости новой модели:
pass rate при ревью PR, поиске ошибок и их исправлении: 77.3 % у GPT-5 против 26.7 % у Sonnet 4 и 44 % у GPT-4o.pass@1 и около 12 % по pass@5 относительно Sonnet 4.Эти результаты, хотя получены из внутренних источников, подтверждают, что GPT-5 обладает ощутимыми преимуществами в специализированных и экономически значимых применениях, где точность и эффективность критичны.
Помимо бизнес-приложений, GPT-5 также подтверждает своё лидерство в ряде независимых бенчмарков, измеряющих более абстрактные когнитивные способности:
Особое внимание заслуживает тестирование безопасности, проведённое более чем за 9000 часов. GPT-5 получила статус «высокого риска» в вопросах биологической и химической безопасности, но остаётся более безопасной, чем конкуренты. Модель демонстрирует 99.9 % устойчивости к джейлбрейкам и 95.5 % отказа от самоповреждающего контента. При «небезопасном» запросе модель не просто отказывает, а аргументированно объясняет пользователю неверность задачи.
GPT-5 Pro заняла первое место среди всех проверенных frontier-LLM на закрытом бенчмарке ARC-AGI Semi-Private. Этот тест оценивает абстрактное рассуждение, стратегическое мышление и решение сложных задач. Примечательно, что, хотя экспериментальная версия o3-preview ранее показывала до 87.5 % точности на ARC-AGI-1, её вычислительная стоимость была значительно выше, что не позволило включить её в публичный рейтинг. Таким образом, GPT-5 Pro признаётся самой мощной из доступных и подтверждённых моделей в этой категории, подчёркивая стремление OpenAI к эффективности ресурсов.
Помимо улучшенной производительности, GPT-5 также выделяется своей ценой. Согласно OpenAI, модель позиционируется как «очень дешевая» - дешевле GPT-4o и решений Anthropic. Стоимость 1 млн входных токенов составляет $1.25, а 1 млн выходных токенов - $10. Кэширование теперь даёт 90 % скидку, тогда как ранее показатель составлял 50 %. Эти ценовые преимущества делают модель более доступной для широкого круга экономических задач.
GPT-5 уже доступна в ChatGPT для аккаунтов Pro/Plus/Team/Free с роутингом, а для Pro-подписчиков предоставлен неограниченный доступ к GPT-5 и GPT-5 Pro. Бесплатные пользователи получают доступ к reasoning-функционалу примерно 2-3 дня в неделю, после чего запросы перенаправляются на gpt-5-mini.
OpenAI утверждает, что GPT-5 решает так называемый «Bernoulli effect» - проблему случайного выбора пути рассуждения в LLM, который не всегда оптимален. Для этого применяются следующие механизмы:
gpt-5-main, gpt-5-thinking, gpt-5-thinking-pro, gpt-5-mini).Несмотря на скептицизм отдельных пользователей, выраженный в соцсетях, консолидированные данные из внутренних бенчмарков и независимых оценок убедительно указывают на значительный прогресс GPT-5 в разных сферах. Модель демонстрирует превосходство над предшественниками и конкурентами в задачах, связанных с обработкой естественного языка, программированием, финансовым анализом и даже абстрактным мышлением.
Однако, как отмечают некоторые аналитики, субъективное ощущение «деградации» может появляться даже при статистически значительном улучшении. Если GPT-4o давала правильный ответ в 30 % случаев, а GPT-5 - в 60 %, то в 35 % ситуаций пользователь всё равно может посчитать более ранний ответ лучшим. Это так называемый «эффект Бернулли» в контексте пользовательского опыта: даже при общем росте качества неизбежны моменты, когда результат новой модели кажется менее оптимальным для привычных сценариев. Жалобы от 1 % из 700 миллионов пользователей (то есть 7 миллионов), из которых 1 % решит их написать, всё равно дадут значительное число - 70 тысяч.
Совокупность доказательств на октябрь 2025 года указывает на то, что GPT-5 - это, действительно, существенный шаг вперёд. Его экономическая эффективность, архитектурные новшества и подтверждённая производительность в прикладных и абстрактных задачах делают его важнейшим игроком на рынке больших языковых моделей, готовым к широкому внедрению в корпоративной практике.
GPT-5 - это не просто эксперимент, а платформа, подготовленная к масштабному использованию в бизнесе, образовании и науке. Она мультимодальна, интегрирована в продуктивные сценарии, предельно точна (особенно в медицине, науке, программировании), а также безопасна и этически контролируема. Модель обучена на данных до октября 2024 года, что делает её одной из самых современных систем, способных учитывать свежие достижения.
Модель GPT-5 Pro заняла первое место среди всех проверенных frontier-LLM на закрытом бенчмарке ARC-AGI Semi-Private. Тесте, оценивающем ...
Многоэтапные сложные сборки. Возможные потоки планирования. Мы сравним: Качество вывода. Скорость сборки. Эффективность отладки.
Performance has more than doubled from GPT‑4o (released spring 2024) to GPT‑5 (released summer 2025), following a clear linear trend. In ...
Consistency: GPT-5 was highly consistent. Gemini was also stable in detection and severity, but varied more in CWE mapping. Claude was ...
Вопросы и ответы