Logo

Perplexity AI ОТКРЫВАЕТ R1 1776: ИИ-МОДЕЛЬ БЕЗ КИТАЙСКОЙ ЦЕНЗУРЫ ДОСТУПНА НА HuggingFace

Американский стартап Perplexity AI выпустил открытую модель R1 1776 на базе DeepSeek-R1, устранив китайскую цензуру для повышения точности. Модель, дообученная с NeMo 2.0 на данных Dialogues от пользователей, доступна на HuggingFace и показала улучшение на 1% на AIME 2024.

21 липня 2025 р., 18:00
2 мин чтения

Американский стартап искусственного интеллекта Perplexity AI объявил об открытом выпуске первой модели с открытым исходным кодом — R1 1776, представляющей собой доработанную версию DeepSeek-R1. Ключевое изменение модели — устранение элементов китайской цензуры, ранее присутствовавших в оригинальной архитектуре. По утверждению разработчиков, это позволило повысить уровень фактической точности и снизить идеологическую предвзятость при сохранении вычислительных возможностей системы.

В официальном блоге Perplexity AI компания описывает технический процесс модификации. Для дообучения R1 1776 использовался фреймворк NeMo 2.0 от Nvidia, широко применяемый для обучения больших языковых моделей. На первом этапе эксперты Perplexity вручную определили список из 300 тем, подверженных цензуре в оригинальной DeepSeek-R1 — это охватывало политические, исторические и социально чувствительные вопросы, традиционно ограничиваемые контролем в Китае.

Для сбора обучающих данных был применён классификатор, позволивший извлечь из реальных диалогов пользователей релевантные промпты по этим темам. Последующая курация заключалась в составлении проверенных и фактически точных ответов, которые использовались для дополнительного дообучения модели с целью повышения её объективности. В результате модифицированная R1 1776, по информации Perplexity, предоставила уровень свободы от китайской цензуры более высокий по сравнению с такими моделями, как o3-mini и Claude 3.5 — двумя наиболее актуальными женщинами на рынке англоязычных больших языковых моделей в 2025 году.

С точки зрения производительности, утверждается, что по синтетическим тестам (бенчмаркингу) различия с исходной версией минимальны: проседание по ключевым метрикам либо отсутствует, либо не превышает доли процента. Более того, на одном из профильных соревнований (AIME 2024) отмечено увеличение метрики на 1 процентный пункт, что исследователи рассматривают как дополнительный индикатор качества решений.

Выход R1 1776 знаменует первую попытку Perplexity выложить в открытый доступ свои веса модели, которые доступны на платформе HuggingFace. Этот шаг является частью широкой тенденции в индустрии ИИ, где открытие исходного кода и моделей используется для повышения прозрачности, а также для привлечение исследовательского внимания мировой аудитории к вопросам этики, качества данных и управления информацией.

Релиз R1 1776 акцентирует продолжающуюся глобальную дискуссию о влиянии цензуры — как национального, так и корпоративного происхождения — на состав и ограниченность знаний, содержащихся в языковых моделях. В условиях растущей интеграции ИИ-систем в образовательные, правовые и медиа-структуры вопросы источников данных, обучающих выборок и политик модерации приобретают первостепенное значение для международного сообщества исследователей, разработчиков и конечных пользователей.

Вопросы и ответы

Введение