Logo

LLM 2025: Сравнение Claude, ChatGPT, Manus и Gemini – Кто Лидер?

Недавние тесты 2025 года сравнивают Claude, ChatGPT, Manus и Gemini. Claude превзошел в копирайтинге, ChatGPT лидирует в разработке, Manus победил в поиске информации, а Gemini 2.5 Pro отличилась в анализе данных. Выбор LLM требует специализации.

15 жовтня 2025 р., 14:34
6 мин чтения

Революция искусственного интеллекта продолжает перестраивать индустрии, предлагая небывальные возможности для автоматизации и оптимизации. В центре этой трансформации - большие языковые модели (LLM), чья роль в создании контента, анализе данных и разработке ПО становится всё более значимой. Однако, несмотря на широкое признание лидерства отдельных игроков, выбор оптимального инструмента для конкретной задачи остаётся нетривиальной проблемой.

Недавние сравнительные тесты, проведённые между ведущими LLM, включая ChatGPT, Grok, Manus, Gemini и Claude, выявили заметные различия в их производительности по разным категориям задач. Эти результаты показывают, что универсального решения пока нет и подчёркивают необходимость осознанного выбора инструмента в зависимости от поставленных целей.

Битва титанов: Сравнительный анализ LLM в прикладных задачах

Исследование, направленное на оценку эффективности LLM в решении распространённых бизнес-задач, охватило несколько ключевых областей: копирайтинг для рекламных материалов, архитектура AI-агентов, анализ источников и составление отчётов, а также создание текстов для лендингов и обработка больших объёмов данных. Для каждой задачи был разработан единый промпт, позволяющий напрямую сопоставить результаты разных моделей.

Копирайтинг: Когда Claude опережает конкурентов

В задаче по созданию рекламного баннера для образовательного продукта, где требовались три креативные концепции с заголовками, подзаголовками, основным текстом, призывом к действию, визуальным оформлением, психологическими триггерами и элементом срочности, модель Claude Opus 4 продемонстрировала наиболее убедительные результаты.

"Победитель: Claude, при чем просто всмятку. Единственный подумал, что цену не надо пихать в лоб на креатив, сделал самый сильный оффер и сам текст выглядит нативно."

Согласно отчёту о тестировании, Claude обогнал соперников, предложив более естественный и коммерчески эффективный подход, избегая прямого указания цены в креативе и формируя более сильное ценностное предложение. Это преимущество, возможно, объясняется более длительным контекстным окном и способностью генерировать развернутые ответы, характерные для моделей Anthropic. В этом контексте модель Claude Sonnet 4, по данным статьи из Habr от 3 июня 2025 года, имеет в четыре раза больше выходных токенов (64 тыс.) по сравнению с флагманской ChatGPT 4o (16 тыс.), что позволяет создавать более объёмные и стилистически выверенные тексты.

В другой задаче - копирайтинге лендинга - Claude также был признан лучшим. Отмечено его превосходство в создании стилистически цельных и менее шаблонных сообщений уже с первого промпта. Тем не менее, модель Claude демонстрирует меньшую способность удерживать контекст и собирать информацию из интернета по сравнению с конкурентами, что делает её более пригодной для задач, где исходные данные полностью предоставляются.

Архитектура AI-агента: Превосходство ChatGPT в разработке

При построении архитектуры AI-агента для трендвотчинга в SMM, где требовалось разработать детальный флоу в n8n для автоматизации мониторинга контента конкурентов, ChatGPT 5.0 показал явное лидерство. Задача включала парсинг видео с более чем 50 000 просмотров, анализ по параметрам и структурированное сохранение результатов.

"Тут победил ChatGPT, а особенно он лучше в том, чтобы входить в роль учителя и помогать решать баги во флоу и объяснять всё в роли наставника."

По мнению тестировщиков, ChatGPT проявил себя как более эффективный инструмент в роли «наставника», способного не только генерировать архитектурные решения, но и помогать в отладке и объяснении сложных технических аспектов. Это коррелирует с общей тенденцией использования ChatGPT для быстрых вопросов, функций Deep Research и в качестве универсального помощника для повседневных задач, как отмечает Илья Плужников в статье от 3 июня 2025 года.

Поиск и анализ информации: Manus как агент-коордминатор LLM

В задаче по поиску лучших практик промптинга в 2025 году и созданию отчёта модель Manus одержала безоговорочную победу.

"Победа однозначно уходит Manus. Многие всё ещё не до конца понимают, в чём его фишка, так вот, это фактически не LLM, а агент, который в ответе сам принимает решение, какую LLM использовать, может применять несколько разных LLM при решении задачи, искать по разным открытым источникам, показывает вам свой виртуальный «компьютер» во время всего процесса."

Manus - это не просто LLM, а многофункциональный AI-агент, способный самостоятельно выбирать и задействовать различные модели для решения задачи, а также взаимодействовать с открытыми источниками информации. Это позволяет ему действовать как оркестратор, эффективно агрегируя данные и формируя комплексные отчёты. Обзор MIT Technology Review от 11 марта 2025 года подтверждает, что Manus, разработанный китайским стартапом Butterfly Effect, является одним из первых «генеральных AI-агентов», использующих несколько моделей ИИ (например, Claude 3.5 Sonnet и Qwen от Alibaba) и автономно действующие агенты. Его уникальная функция «Компьютер Manus» позволяет пользователям наблюдать за процессом работы ИИ и вмешиваться при необходимости. Несмотря на потенциальную нестабильность и проблемы с доступом к платным источникам, его способность к декомпозиции задач и самостоятельному сбору информации делает его мощным инструментом для глубоких исследований.

Анализ больших объёмов данных: Неожиданное лидерство Gemini

В задаче по анализу больших объёмов чувствительных данных, результаты которой не подлежат публикации из-за конфиденциальности, модель Gemini была признана наиболее эффективной.

Gemini 2.5 Pro, выпущенная в марте 2025 года и обновлённая 5 июня 2025 года, представляет собой мультимодальную модель с контекстным окном в 1 миллион токенов, способную обрабатывать до 3 тысяч изображений, 45-60 минут видео и более 8 часов аудио. Её ключевые возможности включают гибкие настройки, мультимодальность и прямой доступ к актуальной веб-информации. Эти характеристики, по-видимому, обеспечили ей преимущество в работе со сложными и объёмными датасетами. Более того, как отмечает статья от Cloud4Y, Gemini 2.5 Pro установила новый стандарт для работы с большими документами и длинными текстами.

Перспективы и стратегии использования LLM

Результаты этих тестов иллюстрируют динамичность рынка LLM и отсутствие единого «лучшего» решения для всех задач. Вместо этого прослеживается тенденция к специализации и комплементарности моделей.

Claude демонстрирует выдающиеся способности в копирайтинге и создании стилистически сложных текстов, благодаря своему большому выходному буферу токенов и возможности тонкой настройки стиля. Однако его ограничения в контекстной памяти и поиске информации указывают на необходимость предварительной подготовки данных.

ChatGPT, будучи универсальным инструментом, остаётся лидером в задачах, требующих интерактивного взаимодействия, помощи в отладке и общего понимания контекста. Его функции Deep Research и возможности кастомизации через GPT-s делают его незаменимым для широкой гаммы повседневных и технических задач.

Manus, как AI-агент, способный оркестрировать работу нескольких LLM и автономно исследовать веб, представляет прорыв в области комплексных исследовательских задач. Его «виртуальный компьютер» предоставляет беспрецедентный уровень прозрачности и контроля над процессом.

Gemini, особенно в версии 2.5 Pro, выделяется в задачах, связанных с мультимодальным анализом и обработкой больших объёмов структурированных и неструктурированных данных, что делает её ценным ресурсом для аналитических приложений.

По мере того как LLM становятся всё более сложными и специализированными, «либо-либо» подход в выборе инструментов уступает место стратегии «и то, и другое». Как метко заметил один из пользователей, «Claude не заменяет ChatGPT, а дополняет его. Как швейцарский нож и мачете - лучше уметь пользоваться обеими». Эта синергия разных моделей, каждая из которых оптимизирована под определённый тип задач, обещает дальнейшее расширение возможностей автоматизации и повышения эффективности в различных областях профессиональной деятельности в 2025 году и вперёд.

Вопросы и ответы

Введение
Битва титанов: Сравнительный анализ LLM в прикладных задачах
Копирайтинг: Когда Claude опережает конкурентов
Архитектура AI-агента: Превосходство ChatGPT в разработке
Поиск и анализ информации: Manus как агент-коордминатор LLM
Анализ больших объёмов данных: Неожиданное лидерство Gemini
Перспективы и стратегии использования LLM