Японская Sakana AI (экс-сотрудники Google) выпустила M2N2 – эволюционный алгоритм, объединяющий модели ИИ без переобучения, удостоенный Best Paper на GECCO'25 в 2025 году. M2N2 экономит ресурсы, предотвращает «катастрофическое забывание» и доступен на GitHub.
Sakana AI разработала эволюционный алгоритм M2N2 для объединения ИИ-моделей без дорогостоящего переобучения, создавая гибридные системы с новыми ...
Японский стартап в области искусственного интеллекта Sakana AI разработал новый метод, который позволяет нескольким большим языковым моделям ...
M2N2 is a model merging technique that creates powerful multi-skilled agents without the high cost and data needs of retraining.
In Natural Niches (M2N2), we propose modifications to the merging function h h to allow the evolution of the merging boundaries, and adjustments ...
Японская компания Sakana AI, основанная бывшими сотрудниками Google, выпустила инновационный эволюционный алгоритм под названием Model Merging of Natural Niches (M2N2), дающий возможность объединять разнообразные модели искусственного интеллекта в комбинированные системы без обычно дорогих и требующих больших ресурсов процессов переобучения. Эта разработка, удостоенная награды Best Paper на конференции GECCO'25 в 2025 году, предлагает парадигму, где будущее ИИ формируется не за счёт одной монолитной модели, а посредством динамичных экосистем взаимодействующих агентов.
Метод M2N2, подробно изложенный в статье «Competition and Attraction Improve Model Fusion» на arXiv, черпает вдохновение из законов естественного отбора:
Гибкие границы слияния (аналог обмена ДНК): В отличие от прежних подходов, требовавших фиксированных точек склейки (например, на уровне слоёв нейронной сети), M2N2 выбирает случайные split-point - позиции в массиве параметров, где происходит разрез. Итоговые веса модели-потомка формируются как смесь параметров двух родительских моделей до и после этой позиции. Если новая модель показывает улучшенные метрики (фитнес), она сохраняется в «архиве» популяции. Этот «генетический оператор» позволяет исследователям обходиться без ручных настроек, существенно расширяя пространство поиска оптимальных комбинаций.
Конкуренция за ресурсы: M2N2 симулирует соперничество между моделями за ограниченные ресурсы, где каждый обучающий датапойнт рассматривается как ресурс с определённой ёмкостью. Если одна модель уже демонстрирует высокую эффективность на конкретном примере, считается, что она «захватила» большую часть этого ресурса, заставляя остальные модели специализироваться на менее освоенных данных. Такой механизм поощряет развитие уникальных навыков и специализацию агентов.
Привлечение для скрещивания (кроссовер особей): В M2N2 выбор «родительских» моделей для слияния не полностью случаен. Первая модель-родитель отбирается на основе её общей производительности (фитнеса). Вторая модель подбирается с учётом принципа «привлечения» - она должна показывать силу там, где первая модель слаба. Этот целенаправленный способ комбинирования взаимодополняющих сильных сторон значительно повышает шансы создания более эффективных гибридных решений.
В совокупности эти идеи образуют мощный генетический алгоритм, способный «обучать» модели практически с нуля, без применения градиентов и обратного распространения ошибки (backprop). Весь процесс сводится к поиску в пространстве параметров при помощи эволюционных операторов.
Sakana AI продемонстрировала универсальность и продуктивность M2N2 в трёх ключевых направлениях:
Одним из центральных преимуществ M2N2 является устранение проблемы «катастрофического забывания» - явления, при котором модель теряет ранее освоенные навыки при обучении новым задачам. Слияние моделей, напротив, сохраняет их исходные компетенции, что подтверждается двуязычной способностью диффузионной модели.
Разработка M2N2 несёт значительные экономические последствия для индустрии ИИ. Вместо того чтобы тратить миллионы на обучение монолитных моделей с нуля, компании смогут комбинировать специализированные решения, создавая гибриды, существенно превосходящие суммарные возможности их частей. Это особенно важно для рынков с ограниченными вычислительными ресурсами.
Как отметил исследовательский директор Sakana AI Роберт Тьярко Ланге, «Технология M2N2 - это не просто очередной академический эксперимент, а практический инструмент, способный изменить экономику разработки ИИ». Авторы предвидят будущее, в котором организации будут поддерживать целые экосистемы моделей ИИ, непрерывно эволюционирующие и сливающиеся для адаптации к новым вызовам.
Тем не менее, существуют ограничения. Возможность слияния зависит от степени сходства моделей. Модели, сильно отклоняющиеся от своих базовых версий, могут оказаться несовместимыми. Sakana AI планирует дальнейшие исследования для разработки стандартизированной метрики совместимости моделей, что позволит обеспечить успешное слияние и контролировать процесс.
Код M2N2 доступен сообществу на GitHub, открывая путь для дальнейшего развития и применения этой технологии. Развивая принципы эволюции, Sakana AI предлагает новый взгляд на построение ИИ, где гибкость, адаптивность и специализация превосходят стремление к единой, всёобъемлющей модели.
Sakana AI разработала эволюционный алгоритм M2N2 для объединения ИИ-моделей без дорогостоящего переобучения, создавая гибридные системы с новыми ...
Японский стартап в области искусственного интеллекта Sakana AI разработал новый метод, который позволяет нескольким большим языковым моделям ...
M2N2 is a model merging technique that creates powerful multi-skilled agents without the high cost and data needs of retraining.
In Natural Niches (M2N2), we propose modifications to the merging function h h to allow the evolution of the merging boundaries, and adjustments ...
Вопросы и ответы