В 2025 году китайские ИИ-модели Kimi K2 и Qwen 3 Coder обогнали западных конкурентов в кодинге, показав экономию до 90% и вынудив OpenAI и Anthropic пересмотреть свои стратегии.
лучший исполнитель с открытым исходным кодом, соответствующий GPT-5-High в pass@5 (32.4%), несмотря на более низкий показатель ...
Скорость генерации кода составляет 92 токена в секунду, а размер контекста — около 256 тыс. токенов. Её можно без проблем использовать в ...
Discover how Chinese AI models achieve 67% on SWE-bench at 1/10th the cost. Compare Qwen 3 Coder, Kimi K2, and GLM 4.5 with Western ...
An economical choice. We designed grok-code-fast-1 to be widely accessible, priced at: $0.20 per million input tokens. $1.50 per million output ...
Comparison between GLM-4.5-Air and Qwen3 Coder 480B A35B Instruct across intelligence, price, speed, context window and more.
НЬЮ-ЙОРК, 9 октября 2025 г. - Индустрия искусственного интеллекта в сфере разработки ПО претерпевает весомые перемены, вызванные появлением ряда высокоэффективных китайских моделей, которые ставят под вопрос господство западных гигантов вроде OpenAI и Anthropic. Последние бенчмарки и практические испытания демонстрируют, что китайские ИИ-модели, а именно Kimi K2, Qwen 3 Coder и GLM 4.5, не лишь опережают свои западные аналоги в решении сложных инженерных задач, но и делают это при существенно меньших расходах.
Отчёт, опубликованный Nebius в июле 2025 года, а также дополнительный анализ от Digital Applied, показывают резкий сдвиг в динамике рынка. «Ландшафт ИИ радикально изменился в 2025 году», - отмечается в одном из комментариев Digital Applied. «Китайские модели не просто конкурируют - они выигрывают».
Ключевым показателем эффективности является бенчмарк SWE-bench, который имитирует реальные задачи по отладке и разработке на основе GitHub PR. По данным Digital Applied, Qwen 3 Coder демонстрирует выдающийся результат в 67 % проверенных задач SWE-bench, за ним следует Kimi K2 с 65 %, что значительно превышает показатель GPT-4 в 44,7 %. В более свежем бенчмарке Nebius, GPT-5-Medium возглавляет общий рейтинг с 29,4 % решённых задач и 38,2 % pass@5, тогда как Qwen3-Coder признан лучшим открытым исполнителем, сравнимым с GPT-5-High по метрике pass@5 (32,4 %).
Однако истинная революция кроется в экономической эффективности этих моделей. Китайские решения позволяют экономить от 50 % до 90 % по сравнению с западными аналогами. Так, Qwen 3 Coder достигает своего 67 % показателя на SWE-bench при стоимости, которая «в 30 раз меньше, чем у Claude 4 Sonnet ($0,10 против $3)», что делает его чрезвычайно привлекательным для масштабного использования. GLM 4.5 - ещё один пример, предлагающий производительность, сопоставимую с Claude 4, при цене $0,11 за миллион токенов и возможностью работать на минимальном аппаратном обеспечении - всего на 8 чипах Nvidia H20.
На корпоративном уровне экономия поражает. Переход с Claude Opus 4 на Kimi K2 способен сэкономить до $178 200 в год при ежемесячном потреблении 1 млрд токенов.
Успех китайских моделей объясняется рядом архитектурных и тренировочных нововведений:
Несмотря на явные плюсы, внедрение китайских ИИ-моделей поднимает ряд вопросов, особенно в сфере безопасности и конфиденциальности данных. «Это обоснованные опасения», - признаёт Digital Applied, указывая на потенциальные риски, связанные с передачей данных на китайские серверы, угрозу интеллектуальной собственности и соответствие нормативам, таким как GDPR и HIPAA.
В ответ на эти опасения предлагаются несколько стратегий снижения рисков:
Рынок ИИ-кодирования претерпевает кардинальные изменения. Если в 2024 году ИИ-кодирование было «премиальной роскошью», то к 2025 году оно превратилось в «товар», доступный широкому кругу пользователей. Прогнозируется, что китайские модели опустят цены ниже $0,01 за миллион токенов, делая ИИ-кодирование «практически бесплатным для большинства сценариев».
Ожидается, что OpenAI и Anthropic либо будут вынуждены согласоваться с новыми ценами, либо сосредоточатся на премиальных функциях, таких как мультимодальное кодирование. Разработчикам рекомендуется активно тестировать новые китайские модели и формировать гибридные стратегии, учитывающие как производительность, так и вопросы безопасности.
Максимальный Pass@5 у моделей 31/52 (59.6 %), но если посмотреть на общее количество хотя бы раз решённых задач по всем, то там будет уже 37. То есть даже для топовых моделей существует непересекающееся множество задач, которые они решить не могут, но решают конкуренты.
Из опен-сорс моделей только GLM4.5 и Qwen3-Coder-480B задают конкуренцию фронтирным.
Grok Code Fast демонстрирует поразительный уровень Resolved Rate за свою цену; весь прогон на 5-ранах по 52 задачам стоил 14 долларов.
Эти данные, собранные сообществом LocalLLaMA, подчёркивают динамичность конкуренции. Даже при доминировании таких моделей, как GPT-5-Medium, остаются уникальные ниши, где другие модели показывают лучшие результаты, что свидетельствует об отсутствии «абсолютного победителя» и о большом потенциале дальнейшей специализации и инноваций. Grok Code Fast, к примеру, оказался исключительно экономичным вариантом, завершив 52 задачи за $14, что представляет «поразительный уровень Resolve Rate за свою цену».
В целом, 2025 год стал поворотным моментом: китайские ИИ-модели не просто догнали, а обогнали западных конкурентов по ключевым показателям эффективности и стоимости, что неизбежно изменит ландшафт разработки программного обеспечения и стратегии технологических компаний по всему миру.
лучший исполнитель с открытым исходным кодом, соответствующий GPT-5-High в pass@5 (32.4%), несмотря на более низкий показатель ...
Скорость генерации кода составляет 92 токена в секунду, а размер контекста — около 256 тыс. токенов. Её можно без проблем использовать в ...
Discover how Chinese AI models achieve 67% on SWE-bench at 1/10th the cost. Compare Qwen 3 Coder, Kimi K2, and GLM 4.5 with Western ...
An economical choice. We designed grok-code-fast-1 to be widely accessible, priced at: $0.20 per million input tokens. $1.50 per million output ...
Comparison between GLM-4.5-Air and Qwen3 Coder 480B A35B Instruct across intelligence, price, speed, context window and more.
Вопросы и ответы