9 октября 2025: Qwen3-VL-235B-A22B-Thinking от Alibaba Cloud заняла 3-е место в мировом бенчмарке LLM, показывая прорыв для открытых мультимодальных моделей.
205 次下载 | Oct 09,2025更新 ... The quantization method is fine-grained fp8 quantization with block size of 128, and its performance metrics are nearly identical ...
Qwen boasts powerful multimodal understanding capabilities, enabling it to process and analyze various types of information such as text, images, audio, and ...
General-purpose large language models. Qwen large language models: Commercial models (Qwen-Max, Qwen-Plus, Qwen-Flash), open-source models (Qwen3, Qwen2.5).
This generation delivers comprehensive upgrades across the board: superior text understanding & generation, deeper visual perception & reasoning, extended ...
9 октября 2025 года, Шанхай - Последние разработки Alibaba Cloud в области больших языковых моделей (LLM) снова привлекли внимание глобального сообщества ИИ. Среди представленных решений особо выделяется Qwen3-VL-235B-A22B-Thinking, которая достигла беспрецедентного результата для открытых мультимодальных моделей, заняв третье место в независимом бенчмарке, отслеживающем производительность ИИ. Этот успех представляет собой значительный шаг вперёд в развитии доступных, передовых ИИ-технологий.
Результаты бенчмарка, детализированные на abdullin.com/llm-benchmarks, показывают следующие ключевые позиции:
Qwen3 Max Instruct: Самая масштабная закрытая модель Qwen, насчитывающая более 1 триллиона параметров, заняла 17-е место. Ее эффективность превышает gpt-5-nano, однако отстает от o1-2024-12-17.Qwen3-VL-235B-A22B-Instruct: Мультимодальная модель с открытыми весами, доступная на Hugging Face, заявила о себе, заняв 19-е место. Этот показатель сравним с gpt-5-nano или deepseek-r1, подчёркивая её возможности в работе с визуальным контентом.Qwen3-VL-235B-A22B-Thinking: Открытая мультимодальная модель, ориентированная на расширенные когнитивные функции, заняла третье место. Это высший результат для модели с открытыми весами за всю историю бенчмарка. Модель доступна для загрузки и изучения на Hugging Face.Выпуск Qwen3-VL-235B-A22B-Thinking с открытыми весами представляет собой стратегический шаг, способствующий демократизации доступа к передовым ИИ-технологиям. Несмотря на существенный размер модели (235 млрд параметров, общий вес - полтерабайта), что усложняет её практическое применение для большинства индивидуальных пользователей, сам факт её открытости стимулирует исследования и разработки. Как отмечает ведущий эксперт, "модели весом в пол-терабайта мало кто будет запускать на практике - не стоит оно того. Куда эффективнее взять gpt-oss-120B с 7-го места или Qwen3-32B с 17-го места". Однако этот прорыв свидетельствует о потенциале, который в скором времени может быть реализован в более компактных и доступных формах.
Ключевое различие Qwen3-VL-235B-A22B-Thinking состоит в её способности к «мышлению» (Thinking), что, по данным Alibaba Cloud, подразумевает расширенные возможности логического вывода и причинно-следственного анализа. Модель поддерживает функциональность «Image-Text-to-Text», позволяя обрабатывать изображения и текст, генерируя текстовые ответы. Среди заявленных характеристик Qwen3-VL особо выделяются:
Эти свойства подчёркивают амбиции Alibaba Cloud в создании целостных мультимодальных ИИ, способных к всестороннему взаимодействию с цифровым и физическим миром. Развитие подобных «думающих» моделей открывает путь к более продвинутому ИИ, способному не просто создавать контент, а и интерпретировать его с глубоким пониманием.
Выход Qwen3-VL-235B-A22B-Thinking в тройку лидеров бенчмарка, особенно в конкурентной среде закрытых моделей, представляет собой важное событие. Это подтверждает, что открытые исходные коды способны не только догонять, но и опережать проприетарные разработки в определённых областях. Хотя текущий размер модели ограничивает её широкое внедрение, её наличие стимулирует дальнейшие исследования в области оптимизации. Ожидается, что прогресс в этой сфере приведёт к созданию более практичных и масштабируемых вариантов, которые смогут применяться в широком спектре задач - от автоматизированных систем до интерактивного контента и научных исследований.
В заключение, победа Qwen3-VL-235B-A22B-Thinking - это не просто техническое достижение; это показатель зрелости и конкурентоспособности открытого ИИ-сообщества, показывающий, что передовые мультимодальные возможности становятся всё более доступными и эффективными.
205 次下载 | Oct 09,2025更新 ... The quantization method is fine-grained fp8 quantization with block size of 128, and its performance metrics are nearly identical ...
Qwen boasts powerful multimodal understanding capabilities, enabling it to process and analyze various types of information such as text, images, audio, and ...
General-purpose large language models. Qwen large language models: Commercial models (Qwen-Max, Qwen-Plus, Qwen-Flash), open-source models (Qwen3, Qwen2.5).
This generation delivers comprehensive upgrades across the board: superior text understanding & generation, deeper visual perception & reasoning, extended ...
Вопросы и ответы