Скрытые мысли как основа коллаборации агентов.

Автор: Денис Аветисян


В каждой итерации взаимодействия агенты преобразуют свои внутренние состояния в лаконичные «мысли», разделяя общее и личное для совместного рассуждения. Эти сжатые представления направляют дальнейшие ответы, позволяя взаимодействовать глубже, чем просто обмен сообщениями.
В каждой итерации взаимодействия агенты преобразуют свои внутренние состояния в лаконичные «мысли», разделяя общее и личное для совместного рассуждения. Эти сжатые представления направляют дальнейшие ответы, позволяя взаимодействовать глубже, чем просто обмен сообщениями.

В эпоху стремительного развития многоагентных систем, основанных на больших языковых моделях, всё острее встаёт вопрос о природе эффективного взаимодействия. В то время как традиционные подходы полагаются на обмен вербальными сообщениями, часто многословными и неоднозначными, возникает фундаментальное противоречие: как достичь истинной координации, когда каждый агент оперирует лишь фрагментарным представлением о намерениях других? В своей работе “Thought Communication in Multiagent Collaboration”, авторы осмеливаются задать вопрос: возможно ли преодолеть ограничения языка, напрямую обмениваясь не самими сообщениями, а глубинными ментальными состояниями, и действительно ли именно в таком “thought communication” кроется ключ к созданию по-настоящему интеллектуальных коллективов, способных к сверхчеловеческому сотрудничеству?

🚀 Квантовые новости

Подключайся к потоку квантовых мемов, теорий и откровений из параллельной вселенной.
Только сингулярные инсайты — никакой скуки.

Присоединиться к каналу

За пределами слов: Ограничения традиционных многоагентных систем

Современные многоагентные системы, часто построенные на базе больших языковых моделей, чрезмерно полагаются на коммуникацию посредством естественного языка. Слова – роскошь, ясность – необходимость. Эта зависимость препятствует эффективному сотрудничеству, особенно в задачах, требующих сложного рассуждения и тонких внутренних состояний. Абстракции стареют, принципы – нет.

Слишком много слов – это слишком много шума. Ясность требует лаконичности. Многословность скрывает истинную сложность задачи. Естественный язык по своей природе многозначен. Каждая сложность требует алиби. Неточность в коммуникации приводит к ошибкам в рассуждениях. Каждый байт информации должен нести смысл.

Эффективное сотрудничество требует не просто обмена информацией, но и глубокого понимания намерений и убеждений других агентов. А это невозможно достичь, полагаясь только на поверхностный анализ текстовых сообщений. Настоящая коммуникация – это не передача информации, а построение общих моделей мира.

Наблюдается производительность многоагентной системы при увеличении количества раундов обсуждения.
Наблюдается производительность многоагентной системы при увеличении количества раундов обсуждения.

Авторы данной работы полагают, что для достижения истинно коллективного интеллекта необходимо выйти за рамки языковой коммуникации. Необходимо разработать новые методы передачи знаний, которые были бы более точными, эффективными и лишенными двусмысленности. Необходимо построить системы, которые способны понимать не только то, что говорят другие агенты, но и то, что они думают.

Истинная ясность – это не просто отсутствие двусмысленности, но и глубокое понимание сути проблемы. Простота – высшая форма сложности. Именно к этому стремились исследователи, разрабатывая предложенный подход.

Скрытые мысли: Новый парадигма для сотрудничества

Исследователи предлагают смелый пересмотр подходов к сотрудничеству между агентами. В эпоху, когда многословность часто принимается за глубину, они предлагают радикальное упрощение: обмен не пространными описаниями, а сжатыми представлениями внутреннего состояния – «мыслями» агентов. Идея, на первый взгляд парадоксальная, на деле оказывается удивительно эффективной. Они называют это «Коммуникацией Скрытых Мыслей», и она обещает перевернуть наше представление о том, как машины могут понимать друг друга.

Каждый агент отвечает на один и тот же вопрос, выбирая подмножество скрытых мыслей ZtZ\_{t}. Агент 1 выбирает автомобиль, исходя из необходимости перевозить багаж, а агент 2 — поезд, исходя из пунктуальности расписания. Оба разделяют мысль о скорости.
Каждый агент отвечает на один и тот же вопрос, выбирая подмножество скрытых мыслей ZtZ\_{t}. Агент 1 выбирает автомобиль, исходя из необходимости перевозить багаж, а агент 2 — поезд, исходя из пунктуальности расписания. Оба разделяют мысль о скорости.

Суть подхода заключается в захвате «Модельного Состояния» агента – комплексной картины его внутреннего мира – и сжатии её в компактное «Скрытое Пространство». Зачем тратить время на описание всех деталей, когда можно передать суть? Они утверждают, что подобный минимализм не только снижает коммуникационную нагрузку, но и способствует более эффективному и прямому пониманию между агентами. Ведь, как известно, избыточность – признак неряшливости, а не глубины.

Вместо длинных предложений и сложных метафор, агенты обмениваются сжатыми векторами, представляющими их ключевые мысли и намерения. Это как телепатия, но без мистики – просто эффективная передача информации. Подобный подход позволяет агентам быстро и точно понимать друг друга, даже в сложных и динамичных условиях. Они, кажется, решили проблему, которую другие пытались решить, добавляя всё больше и больше сложности.

Конечно, не все так просто. Сжатие информации всегда сопряжено с потерями. Но исследователи утверждают, что потери эти незначительны, а выигрыш в эффективности огромен. Они, похоже, нашли золотую середину между точностью и эффективностью, что является признаком настоящего мастерства. В конце концов, суть не в том, чтобы передать все детали, а в том, чтобы передать главное.

Их работа – это вызов общепринятым представлениям о том, как должны взаимодействовать машины. Они предлагают отказаться от многословности и сложности в пользу простоты и эффективности. Это как возвращение к истокам, к чистоте и ясности. В эпоху перегруженности информацией, подобный подход особенно ценен.

ThoughtComm: Реализация скрытой коммуникации с разреженными автокодировщиками

В стремлении к элегантности и эффективности, исследователи представляют ThoughtComm – систему, основанную на принципах минимализма и глубокого понимания когнитивных процессов. В основе ThoughtComm лежат разреженные автокодировщики, инструменты, позволяющие извлекать и представлять суть, отделяя главное от второстепенного. Цель – не просто передать информацию, а сформировать у агентов истинное понимание, выходящее за рамки поверхностного обмена словами.

Автокодировщики служат для выявления и представления двух типов латентных мыслей: частных, формирующих уникальную перспективу каждого агента, и общих, объединяющих их в стремлении к общей цели. Разреженность в структуре автокодировщика играет ключевую роль, отсекая ненужные детали и фокусируясь на самых важных аспектах внутреннего представления агента. Это позволяет достичь большей компрессии без потери информации, подобно тому, как опытный дизайнер удаляет лишние элементы, чтобы подчеркнуть красоту и функциональность.

Для внедрения этих латентных мыслей в процесс генерации, используется метод адаптации префиксов. Этот подход позволяет тонко влиять на последующие этапы рассуждений, направляя агентов к более эффективным решениям. Вместо того, чтобы полагаться на сложные и неоднозначные языковые конструкции, ThoughtComm позволяет агентам обмениваться чистыми, неискаженными представлениями, что приводит к более точному и согласованному сотрудничеству.

Представлены результаты двух агентов ThoughtComm с точностью (сплошная линия) и консенсусом (пунктирная линия) на MATH (Hendrycks et al., 2021) при увеличении длины префикса от 1 до 16.
Представлены результаты двух агентов ThoughtComm с точностью (сплошная линия) и консенсусом (пунктирная линия) на MATH (Hendrycks et al., 2021) при увеличении длины префикса от 1 до 16.

Подход ThoughtComm выходит за рамки простого обмена информацией; он создает канал для передачи тонких нюансов и скрытых предположений, которые обычно теряются при использовании только естественного языка. Это позволяет агентам не просто реагировать на внешние стимулы, но и понимать внутренние мотивы и намерения друг друга, что приводит к более глубокому и осмысленному взаимодействию. В конечном счете, ThoughtComm – это архитектура, спроектированная для устранения лишнего, чтобы оставить только самое важное – истинное понимание.

Верификация верности мыслей: Идентифицируемость и экспериментальная проверка

Исследование, представленное в данной работе, исходит из простого принципа: истинное понимание достигается не усложнением, а упрощением. Авторы, стремясь к созданию эффективной системы для совместной работы агентов, поставили задачу избавления от избыточности, от всего, что не способствует ясности и продуктивности. В результате получился подход, в котором ключевую роль играет выделение и обмен латентными мыслями – основой когнитивных процессов, а не просто поверхностными текстовыми сообщениями.

Теоретической основой для обеспечения надежности данного подхода служит ‘Теория Идентифицируемости’, в частности, ‘Непараметрическая Идентифицируемость’. Эта теория предоставляет гарантию того, что латентные мысли агентов могут быть однозначно восстановлены на основе наблюдаемого поведения, что критически важно для обеспечения надежности и предсказуемости системы. Гарантия однозначности – это не просто математическая формальность, а условие для доверия к результатам совместной работы.

Практическая проверка эффективности разработанного подхода проводилась на сложных математических наборах данных, таких как ‘GSM8K Dataset’ и ‘MATH Dataset’. Результаты показали, что предложенная система не только улучшает точность решений, но и способствует достижению более высокого уровня ‘Консенсуса’ среди агентов. Это означает, что агенты не просто приходят к одному и тому же ответу, но и разделяют общую логику и понимание решения.

Дополнительные результаты производительности многоагентной системы на Qwen-3-1.7B [Yang et al., 2025] при увеличении количества раундов обсуждения.
Дополнительные результаты производительности многоагентной системы на Qwen-3-1.7B [Yang et al., 2025] при увеличении количества раундов обсуждения.

Кроме того, авторы продемонстрировали, что увеличение количества раундов коммуникации, то есть, расширение возможности для итеративного обмена мыслями, способствует повышению производительности системы. Это подтверждает, что эффективная коммуникация – это не просто передача информации, а процесс непрерывного уточнения и углубления понимания. В данном контексте, каждый раунд коммуникации – это не просто шаг к решению, а возможность для каждого агента внести свой вклад в общее понимание проблемы.

В заключение, предложенный подход представляет собой шаг к созданию интеллектуальных систем, способных к эффективной совместной работе и принятию обоснованных решений. При этом, ключевым принципом является не усложнение, а упрощение – избавление от всего, что не способствует ясности и продуктивности. И именно этот принцип делает данную работу ценным вкладом в область искусственного интеллекта.

Исследователи, представляя ThoughtComm, стремятся к упрощению коммуникации между агентами, минуя избыточность естественного языка. Это созвучно высказыванию Джона фон Неймана: “Простота – высшая степень совершенства.” (“Простота – высшая степень совершенства.”, Джон фон Нейман). Рассмотренный подход к обмену латентными ‘мыслями’ вместо развернутых текстовых сообщений – это попытка достичь той самой структурной честности, когда каждая единица информации несет максимальную ценность. Особенно важна идея разреженности (sparsity regularization), поскольку она направлена на удаление всего несущественного, оставляя лишь самое необходимое для эффективного взаимодействия, что соответствует принципам антибарочной эстетики, где ясность ценится выше декоративности.

Что дальше?

Исследование, представленное авторами, открывает, несомненно, интересные возможности в области многоагентного взаимодействия. Однако, необходимо признать: замена естественного языка на латентные «мысли» – это не решение проблемы коммуникации, а лишь её переформулировка. Вопрос о том, насколько адекватно эти латентные представления отражают истинные намерения агентов, остаётся открытым. Стремление к разреженности регуляризации, безусловно, похвально, но не следует забывать, что избыточность – иногда необходимое условие надёжности.

Дальнейшие исследования должны сосредоточиться на проблеме идентифицируемости этих латентных представлений. Как гарантировать, что «мысль», переданная одним агентом, будет правильно интерпретирована другим, особенно в условиях неполной информации и изменяющейся среды? Настоящая сложность заключается не в передаче информации, а в её осмыслении. Игнорирование этой сложности – ненужное насилие над вниманием.

Будущее этого направления видится в создании систем, способных к каузальному рассуждению о намерениях других агентов. Простая передача «мыслей» недостаточна; необходима способность понимать причину этих «мыслей». Плотность смысла – новый минимализм, и только в этом можно надеяться на подлинный прогресс.


Оригинал статьи: https://arxiv.org/pdf/2510.20733.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/