Недавние тесты 2025 года сравнивают Claude, ChatGPT, Manus и Gemini. Claude превзошел в копирайтинге, ChatGPT лидирует в разработке, Manus победил в поиске информации, а Gemini 2.5 Pro отличилась в анализе данных. Выбор LLM требует специализации.
... ChatGPT 4o. Помимо самой обработки текста отдельно выделю у Claude работу со стилем. Гораздо лучше держит стиль на протяжении всего текста
Критерии отбора в мире LLM · Gemini 2.5 Pro Preview 06-05 · DeepSeek-R1-0528 · Claude Opus 4 (20250514) · Claude Sonnet 4 (20250514) · GPT-4.1-2025- ...
Сегодня у нас обзор нового инструмента Manus AI. Искусственный интеллект, который можно заменить программистами. В 2025 году искусственный ...
ChatGPT is a little bit more attentive to the details and a little bit more logical. Claude has a little bit better flavor, voice, and humor. So ...
Below, we highlighted the top 9 LLMs that we think are currently making waves in the industry, each with distinct capabilities and specialized strengths.
The new general AI agent from China had some system crashes and server overload—but it's highly intuitive and shows real promise for the future ...
Революция искусственного интеллекта продолжает перестраивать индустрии, предлагая небывальные возможности для автоматизации и оптимизации. В центре этой трансформации - большие языковые модели (LLM), чья роль в создании контента, анализе данных и разработке ПО становится всё более значимой. Однако, несмотря на широкое признание лидерства отдельных игроков, выбор оптимального инструмента для конкретной задачи остаётся нетривиальной проблемой.
Недавние сравнительные тесты, проведённые между ведущими LLM, включая ChatGPT, Grok, Manus, Gemini и Claude, выявили заметные различия в их производительности по разным категориям задач. Эти результаты показывают, что универсального решения пока нет и подчёркивают необходимость осознанного выбора инструмента в зависимости от поставленных целей.
Исследование, направленное на оценку эффективности LLM в решении распространённых бизнес-задач, охватило несколько ключевых областей: копирайтинг для рекламных материалов, архитектура AI-агентов, анализ источников и составление отчётов, а также создание текстов для лендингов и обработка больших объёмов данных. Для каждой задачи был разработан единый промпт, позволяющий напрямую сопоставить результаты разных моделей.
В задаче по созданию рекламного баннера для образовательного продукта, где требовались три креативные концепции с заголовками, подзаголовками, основным текстом, призывом к действию, визуальным оформлением, психологическими триггерами и элементом срочности, модель Claude Opus 4 продемонстрировала наиболее убедительные результаты.
"Победитель: Claude, при чем просто всмятку. Единственный подумал, что цену не надо пихать в лоб на креатив, сделал самый сильный оффер и сам текст выглядит нативно."
Согласно отчёту о тестировании, Claude обогнал соперников, предложив более естественный и коммерчески эффективный подход, избегая прямого указания цены в креативе и формируя более сильное ценностное предложение. Это преимущество, возможно, объясняется более длительным контекстным окном и способностью генерировать развернутые ответы, характерные для моделей Anthropic. В этом контексте модель Claude Sonnet 4, по данным статьи из Habr от 3 июня 2025 года, имеет в четыре раза больше выходных токенов (64 тыс.) по сравнению с флагманской ChatGPT 4o (16 тыс.), что позволяет создавать более объёмные и стилистически выверенные тексты.
В другой задаче - копирайтинге лендинга - Claude также был признан лучшим. Отмечено его превосходство в создании стилистически цельных и менее шаблонных сообщений уже с первого промпта. Тем не менее, модель Claude демонстрирует меньшую способность удерживать контекст и собирать информацию из интернета по сравнению с конкурентами, что делает её более пригодной для задач, где исходные данные полностью предоставляются.
При построении архитектуры AI-агента для трендвотчинга в SMM, где требовалось разработать детальный флоу в n8n для автоматизации мониторинга контента конкурентов, ChatGPT 5.0 показал явное лидерство. Задача включала парсинг видео с более чем 50 000 просмотров, анализ по параметрам и структурированное сохранение результатов.
"Тут победил ChatGPT, а особенно он лучше в том, чтобы входить в роль учителя и помогать решать баги во флоу и объяснять всё в роли наставника."
По мнению тестировщиков, ChatGPT проявил себя как более эффективный инструмент в роли «наставника», способного не только генерировать архитектурные решения, но и помогать в отладке и объяснении сложных технических аспектов. Это коррелирует с общей тенденцией использования ChatGPT для быстрых вопросов, функций Deep Research и в качестве универсального помощника для повседневных задач, как отмечает Илья Плужников в статье от 3 июня 2025 года.
В задаче по поиску лучших практик промптинга в 2025 году и созданию отчёта модель Manus одержала безоговорочную победу.
"Победа однозначно уходит Manus. Многие всё ещё не до конца понимают, в чём его фишка, так вот, это фактически не LLM, а агент, который в ответе сам принимает решение, какую LLM использовать, может применять несколько разных LLM при решении задачи, искать по разным открытым источникам, показывает вам свой виртуальный «компьютер» во время всего процесса."
Manus - это не просто LLM, а многофункциональный AI-агент, способный самостоятельно выбирать и задействовать различные модели для решения задачи, а также взаимодействовать с открытыми источниками информации. Это позволяет ему действовать как оркестратор, эффективно агрегируя данные и формируя комплексные отчёты. Обзор MIT Technology Review от 11 марта 2025 года подтверждает, что Manus, разработанный китайским стартапом Butterfly Effect, является одним из первых «генеральных AI-агентов», использующих несколько моделей ИИ (например, Claude 3.5 Sonnet и Qwen от Alibaba) и автономно действующие агенты. Его уникальная функция «Компьютер Manus» позволяет пользователям наблюдать за процессом работы ИИ и вмешиваться при необходимости. Несмотря на потенциальную нестабильность и проблемы с доступом к платным источникам, его способность к декомпозиции задач и самостоятельному сбору информации делает его мощным инструментом для глубоких исследований.
В задаче по анализу больших объёмов чувствительных данных, результаты которой не подлежат публикации из-за конфиденциальности, модель Gemini была признана наиболее эффективной.
Gemini 2.5 Pro, выпущенная в марте 2025 года и обновлённая 5 июня 2025 года, представляет собой мультимодальную модель с контекстным окном в 1 миллион токенов, способную обрабатывать до 3 тысяч изображений, 45-60 минут видео и более 8 часов аудио. Её ключевые возможности включают гибкие настройки, мультимодальность и прямой доступ к актуальной веб-информации. Эти характеристики, по-видимому, обеспечили ей преимущество в работе со сложными и объёмными датасетами. Более того, как отмечает статья от Cloud4Y, Gemini 2.5 Pro установила новый стандарт для работы с большими документами и длинными текстами.
Результаты этих тестов иллюстрируют динамичность рынка LLM и отсутствие единого «лучшего» решения для всех задач. Вместо этого прослеживается тенденция к специализации и комплементарности моделей.
Claude демонстрирует выдающиеся способности в копирайтинге и создании стилистически сложных текстов, благодаря своему большому выходному буферу токенов и возможности тонкой настройки стиля. Однако его ограничения в контекстной памяти и поиске информации указывают на необходимость предварительной подготовки данных.
ChatGPT, будучи универсальным инструментом, остаётся лидером в задачах, требующих интерактивного взаимодействия, помощи в отладке и общего понимания контекста. Его функции Deep Research и возможности кастомизации через GPT-s делают его незаменимым для широкой гаммы повседневных и технических задач.
Manus, как AI-агент, способный оркестрировать работу нескольких LLM и автономно исследовать веб, представляет прорыв в области комплексных исследовательских задач. Его «виртуальный компьютер» предоставляет беспрецедентный уровень прозрачности и контроля над процессом.
Gemini, особенно в версии 2.5 Pro, выделяется в задачах, связанных с мультимодальным анализом и обработкой больших объёмов структурированных и неструктурированных данных, что делает её ценным ресурсом для аналитических приложений.
По мере того как LLM становятся всё более сложными и специализированными, «либо-либо» подход в выборе инструментов уступает место стратегии «и то, и другое». Как метко заметил один из пользователей, «Claude не заменяет ChatGPT, а дополняет его. Как швейцарский нож и мачете - лучше уметь пользоваться обеими». Эта синергия разных моделей, каждая из которых оптимизирована под определённый тип задач, обещает дальнейшее расширение возможностей автоматизации и повышения эффективности в различных областях профессиональной деятельности в 2025 году и вперёд.
... ChatGPT 4o. Помимо самой обработки текста отдельно выделю у Claude работу со стилем. Гораздо лучше держит стиль на протяжении всего текста
Критерии отбора в мире LLM · Gemini 2.5 Pro Preview 06-05 · DeepSeek-R1-0528 · Claude Opus 4 (20250514) · Claude Sonnet 4 (20250514) · GPT-4.1-2025- ...
Сегодня у нас обзор нового инструмента Manus AI. Искусственный интеллект, который можно заменить программистами. В 2025 году искусственный ...
ChatGPT is a little bit more attentive to the details and a little bit more logical. Claude has a little bit better flavor, voice, and humor. So ...
Below, we highlighted the top 9 LLMs that we think are currently making waves in the industry, each with distinct capabilities and specialized strengths.
The new general AI agent from China had some system crashes and server overload—but it's highly intuitive and shows real promise for the future ...
Вопросы и ответы