Qwen Image от Alibaba, выпущенный 22.09.2025 (версия Qwen-Image-Edit-2509), — ИИ-генератор с открытым кодом, превосходящий аналоги в точности текста и редактирования. Доступен на HuggingFace, имеет 5,7k звёзд на GitHub.
Qwen Chat offers comprehensive functionality spanning chatbot, image and video understanding, image generation, document processing, web search integration, ...
Qwen-Image is a powerful image generation foundation model capable of complex text rendering and precise image editing. License. Apache-2.0 license · 5.7k stars ...
In this blog post, we will provide a featured list of open-source models that stand out for their ability in generating creative visuals.
Китайская техноиндустрия представила важное нововведение в сфере генерации изображений: Qwen Image - бесплатный генератор изображений с открытым исходным кодом, который, как заявляют разработчики, превосходит большинство существующих решений. Модель, созданная командой Qwen из Alibaba, позиционируется как мощный фундамент для задач создания и редактирования изображений, отличающийся способностью точно воспринимать текст и сохранять стилистическую целостность.
Модель, распространяемая под лицензией Apache 2.0, демонстрирует продвинутые возможности в разных аспектах:
Текущая бета-версия Qwen Image доступна для тестирования на платформе HuggingFace, что позволяет разработчикам и энтузиастам оценить её возможности. На GitHub репозиторий проекта уже набрал 5,7k звёзд и 308 форков, что свидетельствует о значительном интересе сообщества.
Недавние обновления, представленные в версии Qwen-Image-Edit-2509, выпущенной 22 сентября 2025 года, ещё сильнее расширяют функционал модели. Эти улучшения включают:
Важно отметить, что, по словам разработчиков, для получения оптимальных результатов и стабильности редактирования рекомендуется применять «переписывание запросов» (prompt rewriting).
В сфере генерации изображений Qwen Image появляется на фоне уже устоявшихся и активно развивающихся проектов. Среди них:
На фоне этих конкурентов Qwen Image выделяется своей универсальностью, точностью редактирования, особенно в работе с текстом, и полной открытостью кода без ограничений на использование. Это делает его привлекательным решением для широкого круга пользователей.
Qwen Image интегрирован в более широкую экосистему, что обеспечивает его доступность и гибкость применения:
Как и другие ИИ-модели генерации изображений, Qwen Image сталкивается с вопросами авторского права и этики. Судебные процессы против компаний, стоящих за популярными моделями, такими как Stable Diffusion, поднимают вопросы о возможных нарушениях авторских прав при использовании изображений, полученных из тренировочных наборов, содержащих защищённый контент. Qwen Image лицензируется под Apache 2.0, что определяет условия его использования, но не освобождает пользователей от ответственности за потенциальные юридические риски, связанные с генерируемым контентом. Сложность установления принадлежности авторских прав на изображения, созданные ИИ, остаётся актуальной проблемой.
В заключение, Qwen Image представляет собой значительный прорыв в области открытых моделей генерации изображений, предлагая мощный набор средств для создания и редактирования контента. Его открытый подход и постоянные улучшения, такие как в версии Qwen-Image-Edit-2509, делают его важным игроком на стремительно развивающемся рынке ИИ-графики.
Оригинальная статья сообщает о выпуске Qwen Image, описывая её как «бесплатную, с открытым исходным кодом» и «возможно, самую сильную бесплатную модель изображений на сегодняшний день». В статье перечислены основные возможности, такие как поддержка различных стилей, понимание текстовых подсказок, точное редактирование изображений и сохранение исходного стиля, а также подчёркивается её статус полностью открытого исходного кода без ограничений по использованию. Ссылка для тестирования модели ведёт на Hugging Face.
Сравнение с внешними источниками подтверждает большинство заявлений. Документация Qwen-Image на GitHub также описывает модель как «мощную фундаментную модель генерации изображений», способную к «комплексной текстовой отрисовке и точному редактированию изображений». Она подтверждает статус открытого исходного кода под лицензией Apache 2.0. Информация о поддержке различных стилей, включая фотореалистичные, импрессионистские и аниме, также есть в обзоре BentoML. Заявление о «мощном визуально-текстовом выравнивании» подтверждается тем, что модель «интегрирует рассуждения о языке и макете непосредственно в свою архитектуру, обеспечивая детализированное встраивание текста в изображения с высокой точностью и семантической корректностью», как указано в обзоре BentoML.
Однако утверждение «Qwen Image goes public (and free)» и «возможно, самая сильная бесплатная модель изображений на сегодняшний день» требует уточнения. Хотя модель действительно открыта и доступна бесплатно для большинства применений, документ на GitHub упоминает различные лицензии для разных компонентов и версий. Например, FLUX.1 Kontext dev (модель редактирования) доступна бесплатно для исследований и некоммерческого использования, а FLUX.1 pro поддерживает коммерческое использование, но с ограничениями доступа. Точно так же HiDream-I1 и HiDream-E1 выпущены под лицензией MIT. Таким образом, хотя Qwen Image открыта и бесплатна, контекст «самой сильной» модели требует более детального сравнения с конкурентами. Обзор BentoML перечисляет целый ряд других мощных открытых моделей, таких как Stable Diffusion, FLUX.1, HiDream-I1 и HunyuanImage-3.0, каждая из которых имеет свои сильные стороны и области применения. Оригинальная статья не предоставляет сравнительных данных, подтверждающих превосходство Qwen Image над этими конкурентами.
Заявление о том, что модель «понимает подсказки как ChatGPT», является сравнением, которое может создавать определённые ожидания у читателя. Хотя Qwen Image действительно демонстрирует сильное понимание текста, аналогия с ChatGPT, известным своими возможностями обработки естественного языка, может быть преувеличением по отношению к контексту генерации изображений. Тем не менее, как GitHub, так и BentoML подчёркивают её способности к «комплексной текстовой отрисовке, особенно для китайского языка», и «высокой точности и семантической корректности».
Заявления о точном редактировании изображений («Can edit images with precision (think Flux Kontext quality)») и сохранении оригинального стиля («Preserves original style — no plastic mess, no hallucinated chaos») подтверждаются. Документация GitHub упоминает Qwen-Image-Edit-2509, которая «значительно улучшает согласованность» при редактировании и «поддерживает редактирование текста, шрифтов, цветов и материалов». Обзор BentoML также отмечает, что Qwen-Image «поддерживает как создание текста в изображении, так и редактирование изображений, включая перенос стиля, улучшение деталей, вставку или удаление объектов, изменение позы и замену фона». Ссылка на «Flux Kontext quality» также обоснована, поскольку источники указывают, что FLUX.1 Kontext dev также является мощной моделью для редактирования изображений.
8 листопада 2025 р.
Qwen Chat offers comprehensive functionality spanning chatbot, image and video understanding, image generation, document processing, web search integration, ...
Qwen-Image is a powerful image generation foundation model capable of complex text rendering and precise image editing. License. Apache-2.0 license · 5.7k stars ...
In this blog post, we will provide a featured list of open-source models that stand out for their ability in generating creative visuals.
Вопросы и ответы