Logo

Tree Of Thoughts: Как Новая Методика Изменяет Рассуждения Больших Языковых Моделей

Методика Tree of Thoughts (ToT), представленная в 2023 году, структурирует рассуждения LLM как дерево, улучшая решения в задачах, где важен системный перебор. Авторы Хао Пинтао и др. из Пекина и Microsoft Research предлагают использовать LLM для оценки "мыслей" в дереве. Это указывает на будущее усложнение промптинга.

21 липня 2025 р., 17:47
3 мин чтения

В 2023 году исследователи представили новую методику повышения эффективности больших языковых моделей (LLM) — Tree of Thoughts (ToT), опубликованную в препринте на arXiv (ссылка). В отличие от существующих протоколов взаимодействия с LLM, метод ToT фокусируется на структурировании рассуждений моделей в виде разветвлённого дерева, потенциально улучшая качество решений для ряда классов задач.

Существуют различные подходы к организации взаимодействия пользователей с LLM. Базовая схема подразумевает формулировку задачи в одном запросе и получение на выходе финального ответа. Более развитая техника, Chain of Thoughts (CoT), требует, чтобы LLM излагала решение пошагово, фиксируя ход рассуждений и промежуточные этапы вывода—метод получил широкое распространение с 2022 года, повысив интерпретируемость ответов языковых моделей. Итеративное уточнение (iterative refinement) вовлекает дополнительный цикл критики и доработки предложений, когда модель сама или в сочетании с внешним агентом анализирует и улучшает своё решение через серию запросов и ответов. Для задач, в которых оправдано агрегирование вариантов, кратные прогоны вышеуказанных техник позволяют ансамблировать варианты ответов и формировать итоговое решение на основе комбинации нескольких выводов.

Однако статья "Tree of Thoughts: Deliberate Problem Solving with Large Language Models" авторов Хао Пинтао и др. из университета Пекина и Microsoft Research фиксирует переход к более продвинутому алгоритмическому взаимодействию. Ключевая идея ToT заключается в том, чтобы представлять развитие рассуждений LLM не как линейную последовательность шагов (как в CoT), а как дерево: начальная задача формирует корень, а каждая ветвь — отдельную мысль или гипотезу, расширяющую пространство поиска ответа. Для роста дерева пользователь либо сама LLM инициирует новые разветвления, отправляя уточняющие запросы о возможных шагах на базе уже принятых решений.

Для оценки качества каждого промежуточного узла — потенциальной “мысли” в дереве — авторы предлагают также привлекать саму LLM, поскольку в ряде испытаний именно языковая модель способна адекватно ранжировать корректность и перспективность промежуточных шагов — зачастую лучше, чем генерировать их с нуля. Это позволяет алгоритмически обходить дерево, используя эвристики и механизм поиска решений, при котором модель отбирает наиболее продуктивные ветви. С исследовательской точки зрения интересно, что авторы специально подчеркивают слабую универсальность и быстро устаревающий характер конкретных алгоритмов оценки и обхода: ключевой вклад заключается не в конкретном способе обхода дерева, а в самой структуре подхода.

Эмпирические результаты, столь важные в сравнении эффективности генеративных моделей, показывают, что ToT не даёт радикального улучшения по множеству метрик, но оказывается значимо полезным для тех случаев, где классическая логика поиска по дереву доказала свою состоятельность—например, при решении мини-кроссвордов (заполнение буквами сетки 5×5 по заданным вопросам). Согласно опубликованным экспериментам, в этих условиях выигрыш обусловлен более системным перебором вариантов, которому способствует разветвлённая структура рассуждений. Это подтверждает предположение авторов о релевантности ToT для задач, где структура пространства решений может быть эффективно декомпозирована.

Текущий этап развития языковых моделей поднимает вопрос о стандартизации протоколов взаимодействия и возможности создания универсальных “чёрных ящиков” над LLM, скрывающих от пользователя избыточную сложность промптинга. Исследования подобные ToT указывают, что будущие схемы эксплуатации искусственного интеллекта могут схлопнуть подобные деревья рассуждений в недоступные для пользователя внутренние механизмы, усложняя процедуру разъяснения структуры ответа и контроля за ходом генерации.

Для дополнительного ознакомления с деталями подхода и результатами авторы рекомендуют видеоматериал: получасовой обзор работы.

Реализация Tree of Thoughts подтверждает: структурирование рассуждений и поиск решений на базе деревьев мыслей способен повысить эффективность LLM для отдельных классов задач, где системный анализ пространства решений критически важен. Однако универсальность применения подхода, равно как и его превосходство над более простыми протоколами, остаётся предметом дальнейших исследований.

Вопросы и ответы

Введение