Logo

Новые Стандарты LLM: Claude Opus 4.1 и Haiku 4.5 Удивляют Рынок

5 августа 2025 года Anthropic обновила Claude Opus 4.1 для кодирования, а 15 октября представила Claude Haiku 4.5, которая быстрее Haiku Sonnet 4 и в 3 раза дешевле. Обе модели повышают эффективность в агентских задачах и обработке данных.

16 жовтня 2025 р., 20:24
5 мин чтения

Прорыв в области Large Language Models: Claude Opus 4.1 и Haiku 4.5 задают новые стандарты производительности и эффективности

В условиях обостряющегося соперничества на рынке больших языковых моделей (LLM) компания Anthropic представила два важнейших обновления: Claude Opus 4.1 и Claude Haiku 4.5. Эти релизы, хоть и были частично затмены ажиотажем вокруг инициатив конкурентов, демонстрируют существенный прогресс в ключевых сферах, таких как программирование, агентские задачи и обработка данных в реальном времени.

Claude Opus 4.1: Скрытый чемпион кодирования и рассуждений

5 августа 2025 года Anthropic анонсировала Claude Opus 4.1. Этот выпуск является обновлением флагманской модели Opus 4 и направлен на повышение эффективности в агентских задачах, кодировании в реальных условиях и задачах на рассуждение. Показатели улучшения, на первый взгляд, могут показаться скромными, однако эксперты подчёркивают их значимость.

  • SWE-bench Verified: Модель достигла результата в 74,5 %, что на 2 процентных пункта выше, чем у её предшественника, Claude Opus 4. Это свидетельствует о заметном прогрессе в автоматизации задач разработки программного обеспечения.
  • AIME (American Invitational Mathematics Examination): Зафиксирован рост в 2,5 %.
  • Агентские задачи: Производительность возросла на 4 %.

«Это не просто небольшие приросты, особенно для насыщенных бенчмарков, которые освоены уже более чем на 50-60 %», - отмечает эксперт, указывая на то, что даже минимальные улучшения в этих условиях являются серьёзным инженерным достижением. «В оставшихся процентах всегда таится длинный хвост распределения, так что даже +0,1 % метрики - уже достижение и на практике может заролять.»

Представители Rakuten Group, одного из партнёров Anthropic, подтверждают, что Opus 4.1 «превосходно справляется с точным выявлением исправлений в больших кодовых базах без внесения ненужных корректировок или ошибок», что делает его предпочтительным инструментом для повседневной отладки. Компания Windsurf также сообщила, что Opus 4.1 продемонстрировал «одно стандартное отклонение улучшения» по сравнению с Opus 4 в их внутреннем тесте для младших разработчиков.

Opus 4.1 доступен платным подписчикам Claude, а также через Claude Code, API, Amazon Bedrock и Google Cloud's Vertex AI. Цена осталась на уровне Opus 4.

Claude Haiku 4.5: Скорость, экономичность и масштабируемость

15 октября 2025 года Anthropic представила Claude Haiku 4.5 - «самую быструю и экономически выгодную» модель компании. Этот релиз позиционируется как важный шаг в демократизации доступа к высокопроизводительным LLM, предлагая сопоставимое с Claude Sonnet 4 качество работы, но с трёхкратным снижением стоимости и двукратным увеличением скорости.

Гай Гур-Ари, представитель Anthropic, отметил: «Claude Haiku 4.5 достиг уровня, который казался невозможным: качество кодирования, близкое к передовым моделям, с невероятной скоростью и ценовой эффективностью.»

Ключевые особенности Haiku 4.5:

  • Производительность в кодировании: В задачах написания кода и «агентских» задачах, таких как использование компьютера от имени пользователя, Haiku 4.5 показывает результаты, не уступающие Sonnet 4.
  • Мониторинг в реальном времени: Модель способна «мониторить тысячи потоков данных одновременно в режиме реального времени», что делает её идеальной для отслеживания законодательных изменений, инвестиционных рисков и рыночных сигналов.
  • Быстрое обобщение информации: Haiku 4.5 может суммировать «десятки исследовательских материалов» в нужном формате «за пару часов, а не недель».
  • Архитектура для мультиагентных систем: Подходит для создания субагентов благодаря эффективной обработке «параллельных вычислений» и «большого объёма информации». Например, Sonnet 4.5 может декомпозировать сложные проблемы на пошаговые планы, тогда как Haiku 4.5 будет параллельно выполнять подзадачи.
  • Доступность: Стоимость работы через API составляет $1 за 1 млн входных токенов и $5 за 1 млн выходных токенов (около 750 тысяч слов).

Зах Ллойд подчеркнул прорыв Haiku 4.5 «для агентского кодирования, особенно для оркестрации саб-агентов и задач использования компьютера». Бен Лафферти резюмировал: «Claude Haiku 4.5 размывает границы этого компромисса: это быстрая передовая модель, которая сохраняет экономичность и сигнализирует о направлении развития этого класса моделей.»

Примечательно, что Anthropic также провела углублённую оценку безопасности Haiku 4.5, которая показала «статистически значимо более низкий общий уровень несовместимого поведения», чем у Sonnet 4.5 и Opus 4.1. Модель была классифицирована по стандарту AI Safety Level 2 (ASL-2), что указывает на более низкий уровень рисков.

Контекст конкуренции: Новая гонка за лидерство

Релизы Anthropic происходят в условиях усиливающейся конкуренции на рынке LLM. Выпуск Opus 4.1 практически совпал с ожидаемым анонсом GPT-5 от OpenAI, а анонс Haiku 4.5 - всего через две недели после выхода Sonnet 4.5. Это подчёркивает стремление Anthropic не только догонять, но и перехватывать инициативу в ключевых областях.

Инсайдеры ранее сообщали, что новая модель OpenAI превосходит Claude Opus 4 в программировании. В этом контексте экстренный выпуск обновлённых версий Anthropic может быть воспринят как попытка «сократить отставание» и укрепить свои позиции.

Обновления Anthropic, особенно Haiku 4.5 с его акцентом на скорость и экономичность, не только предоставляют новые возможности для разработчиков и предприятий, но и свидетельствуют о сдвиге парадигмы в развитии LLM, где помимо абсолютной производительности всё большую роль играют эффективность, доступность и специализированные функциональные возможности.

Модели Claude Haiku 4.5 доступны в Claude, Claude Code, API, Amazon Bedrock и Google Cloud's Vertex AI.

Вопросы и ответы

Прорыв в области Large Language Models: Claude Opus 4.1 и Haiku 4.5 задают новые стандарты производительности и эффективности
Claude Opus 4.1: Скрытый чемпион кодирования и рассуждений
Claude Haiku 4.5: Скорость, экономичность и масштабируемость
Контекст конкуренции: Новая гонка за лидерство