Автор: Денис Аветисян
Новое исследование показывает, что взаимодействующие искусственные агенты способны самостоятельно разрабатывать систему коммуникации для обозначения количества, демонстрируя точность и произвольность в кодировании.

Агенты, обученные взаимодействию, демонстрируют способность к формированию числовых представлений, однако испытывают трудности с обобщением за пределы тренировочного набора и не обладают достаточной композиционной структурой.
Несмотря на развитые системы выражения числовых значений в человеческих языках, остается неясным, достаточно ли лишь необходимости коммуникации для формирования численных представлений у искусственных агентов. В работе ‘The emergence of numerical representations in communicating artificial agents’ исследуется, как два агента, основанных на нейронных сетях, формируют систему коммуникации для передачи числовых значений, используя как дискретные символы, так и непрерывные эскизы. Полученные результаты демонстрируют, что агенты способны достичь высокой точности передачи выученных чисел, однако их код оказывается некомпозиционным и не обобщается на невидимые ранее значения. Какие дополнительные механизмы необходимы для формирования у искусственных агентов полноценных, обобщающих численных систем, подобных человеческим?
За пределами простого сигналинга: Искусство численного понимания
Эффективная коммуникация выходит за рамки простой передачи данных, требуя от участников разделяемого понимания количества представляемых объектов — так называемой «численности». Именно способность воспринимать и интерпретировать количество играет ключевую роль в успешном обмене информацией. Исследования показывают, что даже самые простые организмы демонстрируют базовое понимание количества, что указывает на эволюционную значимость этой способности. В контексте сложных систем коммуникации, разделяемое понимание численности позволяет избежать двусмысленности и обеспечивает точную передачу информации о количестве ресурсов, угроз или возможностей. Отсутствие такого общего понимания может привести к ошибкам в интерпретации, снижая эффективность коммуникации и, как следствие, влияя на поведение и принятие решений.
Существующие системы коммуникации, будь то человеческая речь или сигнальные системы животных, зачастую испытывают трудности при обозначении новых, ранее не встречавшихся количеств. Традиционные подходы, основанные на фиксированных сигналах для каждого числа, оказываются неэффективными и не масштабируемыми, поскольку требуют создания бесконечного набора сигналов. Это проявляется как в сложностях, с которыми сталкиваются люди при описании больших или необычных групп предметов, так и в ограниченности коммуникативных возможностей многих видов животных. В связи с этим, возрастает потребность в разработке более гибких и универсальных кодов, способных представлять любые количества посредством комбинации ограниченного набора элементов, подобно тому, как десятичная система позволяет выразить любое число, используя лишь десять цифр. Именно такая универсальность, позволяющая адаптироваться к новым количественным значениям без необходимости обучения новым сигналам, является ключевым фактором эффективной коммуникации.
Произвольность символов, используемых для обозначения количества предметов, представляет собой значительную проблему в развитии эффективных стратегий коммуникации. В отличие от сигналов, имеющих естественную связь с обозначаемым объектом, абстрактные символы требуют от обучающихся установления связи между знаком и количеством, что требует когнитивных усилий и времени. Это особенно проявляется при представлении новых или необычных количеств, когда ранее усвоенные ассоциации оказываются неприменимыми. Следовательно, успешная коммуникация, основанная на символическом кодировании, зависит от способности системы быстро и надежно устанавливать и поддерживать произвольные соответствия между символами и числовыми значениями, что является сложной задачей для многих существующих коммуникативных систем и требует развития гибких механизмов обучения и адаптации.

Референциальная игра: Раскрытие принципов обучения коммуникации
“Референциальная игра” представляет собой задачу, разработанную для оценки и тренировки коммуникативных способностей агентов, заключающуюся в передаче информации о количестве объектов (численности) друг другу. В рамках этой задачи, агенты должны научиться эффективно кодировать и декодировать информацию о количестве, используя различные методы коммуникации. Оценка успешности коммуникации основывается на способности получателя правильно определить численность, переданную отправителем. Задача моделирует базовый аспект человеческого общения — передачу количественных данных — и позволяет исследовать стратегии, которые агенты разрабатывают для достижения взаимопонимания в условиях неполной информации и шума.
Обучение агентов в рамках «Референциальной Игры» осуществляется посредством нейронных сетей, взаимодействующих друг с другом и получающих опыт методом проб и ошибок. Процесс обучения направляется функцией потерь Multi-Class Hinge Loss, которая оценивает разницу между предсказанным классом (количеством) и истинным значением. Эта функция потерь побуждает агентов оптимизировать свои стратегии коммуникации, минимизируя ошибку классификации и повышая точность передачи информации о численности. Использование функции Multi-Class Hinge Loss позволяет эффективно обучать агентов, даже в условиях неполной или зашумленной информации.
Агенты в процессе обучения используют два основных метода коммуникации: дискретную и непрерывную. Дискретная коммуникация предполагает использование выученных токенов — дискретных символов, обозначающих определенные значения. Непрерывная коммуникация, в свою очередь, осуществляется посредством скетчей — графических изображений, позволяющих агентам передавать информацию в виде непрерывного сигнала. Оба метода позволяют агентам обмениваться информацией о численности объектов, что является ключевой задачей в рамках эксперимента «Референциальная игра».

Достижение обобщения: Точность, композиционность и границы познания
Ключевым показателем успешности коммуникации является “точность” — способность однозначно сопоставлять каждый сигнал с конкретным числовым значением. Эта точность поддерживается минимизацией условной энтропии H(s|q), где s — сигнал, а q — количество. Эксперименты показывают, что агенты достигают высокой точности коммуникации, особенно в условиях “Diff”, когда отправитель и получатель наблюдают различные экземпляры одного и того же числового значения. В данной конфигурации агенты демонстрируют способность эффективно передавать информацию о количестве, несмотря на визуальные различия в представлении, что указывает на устойчивость механизма коммуникации к вариациям входных данных.
Композициональность в контексте коммуникации подразумевает способность агентов комбинировать существующие сигналы для представления новых, ранее не встречавшихся количеств. Это позволяет расширить диапазон выражаемых числительностей, поскольку агенты не ограничены предопределенным набором сигналов для каждой конкретной величины. Вместо этого, используя базовые сигналы как строительные блоки, они могут выразить произвольные значения, комбинируя их различными способами. Данный механизм позволяет эффективно кодировать и передавать информацию о широком спектре количеств, значительно превосходящем размер исходного словаря сигналов.
Агенты используют различные типы энкодеров для преобразования входных сигналов в представления чисел. Дискретные сигналы обрабатываются с помощью LSTM-энкодеров (Long Short-Term Memory), которые эффективно захватывают последовательную информацию. Для обработки визуальных представлений в виде «набросков» (Sketches) используются ViT-энкодеры (Vision Transformer), позволяющие извлекать признаки из изображений. Оба типа энкодеров преобразуют входные данные в векторные представления, кодирующие информацию о «численности» (Numerosity), что позволяет агентам эффективно понимать и передавать количественную информацию.

Выходя за рамки известного: Интерполяция, экстраполяция и пределы обобщения
В области машинного обучения и статистического анализа, понятия интерполяции и экстраполяции играют ключевую роль в оценке способности системы к обобщению. Интерполяция относится к процессу оценки значений внутри диапазона данных, использованных при обучении модели — другими словами, предсказание значений, которые находятся между известными точками. В отличие от этого, экстраполяция подразумевает предсказание значений за пределами этого диапазона, опираясь на тенденции, выявленные в обучающих данных. Успешная экстраполяция значительно сложнее, поскольку требует от модели способности к обобщению за пределы непосредственного опыта, и, следовательно, является важным показателем её гибкости и надёжности. Именно способность к эффективной экстраполяции позволяет моделям успешно применять полученные знания к новым, ранее не встречавшимся ситуациям.
Успешная обобщающая способность системы напрямую зависит от способности как к интерполяции, так и к экстраполяции данных. Исследования показали, что при использовании эскизной коммуникации, система демонстрирует информационную эффективность, достигая условной энтропии всего 1.348 даже при работе с количествами, выходящими за пределы тренировочного набора данных. Это свидетельствует о высокой устойчивости и гибкости системы в обработке незнакомой информации, а также о её способности эффективно кодировать и передавать числовые значения даже в условиях ограниченной информации и экстраполяции.
Исследования показали, что частота появления конкретного количества объектов в обучающей выборке существенно влияет на легкость его усвоения и последующей коммуникации. Наблюдается явная корреляция между частотой встречаемости числа в обучающих данных и особенностями его графического представления, создаваемого испытуемыми. Визуализация этих различий, выполненная в виде тепловых карт, демонстрирует, что числа, представленные в обучающей выборке чаще, кодируются в более стандартизированных и узнаваемых схемах, в то время как редко встречающиеся количества вызывают больше вариативности в визуальных решениях. Этот феномен подчеркивает, что способность системы эффективно обобщать информацию зависит не только от абсолютного количества данных, но и от их распределения и частоты встречаемости отдельных элементов.
![Модель успешно экстраполирует данные, используя ранее выбранное сообщение для максимальной предварительно обученной численности, как показано на примерах экстраполяции из диапазона [1-20] в 25 (выделено красным), и демонстрирует стабильные результаты как при экстраполяции, так и при интерполяции.](https://arxiv.org/html/2602.10996v1/x13.png)
Исследование показывает, что агенты способны разрабатывать собственные системы кодирования для обозначения количества, однако их способность к обобщению за пределами выученных чисел ограничена отсутствием композиционной структуры. Это напоминает о том, что даже самые изящные системы коммуникации могут оказаться хрупкими перед лицом незнакомых данных. Клод Шеннон однажды сказал: «Теория коммуникации — это скорее искусство мысли, чем набор формул». Действительно, в данном случае, процесс формирования языка агентами — это не просто алгоритмическая задача, а эволюция, зависящая от взаимодействия и способности к абстракции. Попытки создать универсальную систему, игнорируя контекст и ограничения, обречены на провал, ведь масштабируемость — лишь слово, которым оправдывают сложность.
Что дальше?
Исследование продемонстрировало, как агенты способны вырастить общую систему обозначения количества, но эта система оказалась хрупкой. Она возникла из взаимодействия, словно порядок, выросший на кратком участке между двумя неизбежными сбоями. Точность и произвольность проявились, но за пределами выученных чисел проявилась слабость. Это не недостаток реализации, а фундаментальное свойство любой системы — ее предрасположенность к провалу там, где не было предвидения.
Следующий шаг лежит не в усовершенствовании алгоритмов, а в исследовании структур, которые позволят агентам строить композиционные представления. Не просто запоминать числа, но понимать принципы их построения. Архитектура — это способ откладывать хаос, но отложенный хаос все равно рано или поздно проявится. Важно не столько создание «лучших практик», сколько выявление тех, которые просто оказались выжившими.
Истинным вызовом является не создание искусственного интеллекта, а создание систем, способных адаптироваться к неизбежному. Порядок — это лишь кеш между двумя сбоями, и искусство заключается в том, чтобы этот кеш эффективно использовать. Необходимо исследовать, как агенты могут не просто коммуницировать о количестве, но и рассуждать о нем, экстраполировать и обобщать, даже когда сталкиваются с неизвестным.
Оригинал статьи: https://arxiv.org/pdf/2602.10996.pdf
Связаться с автором: https://www.linkedin.com/in/avetisyan/
Смотрите также:
- Квантовая суперпозиция: новая интерпретация вероятности
- Ускорение генеративных моделей: новый подход к вычислению матричной экспоненты
- Квантовый скачок: от лаборатории к рынку
- Ускорение вычислений: Монте-Карло и линейные системы
- Тензорные сети и комбинаторные поиски: новый подход к сложным задачам
- Квантовая геометрия управления: плавные траектории в пространстве состояний
- Эффективный параллелизм: iCIPT2 на службе квантифицируемой химии
2026-02-12 23:57