Понимание чужих мыслей: как искусственный интеллект учится сопереживать

Автор: Денис Аветисян

В статье представлены материалы второй научно-практической конференции, посвященной развитию искусственного интеллекта на основе принципов теории разума.

Обзор ключевых докладов и перспектив развития систем ИИ, способных к социальному выводу и пониманию намерений человека.

Несмотря на значительные успехи в области искусственного интеллекта, создание систем, способных к глубокому пониманию человеческих намерений и социальных взаимодействий, остается сложной задачей. Данный сборник материалов представляет собой итоги работы 2-го семинара ‘Proceedings of the 2nd Workshop on Advancing Artificial Intelligence through Theory of Mind’, посвященного развитию искусственного интеллекта посредством концепции «теории разума». В представленных исследованиях рассматриваются подходы к созданию ИИ-систем, способных к социальным умозаключениям и этичному взаимодействию с человеком, что является ключевым шагом к более естественному и эффективному сотрудничеству. Какие новые горизонты открываются для разработки ИИ, способного не просто обрабатывать информацию, но и понимать ее контекст и смысл с точки зрения человеческого разума?

Иллюзия понимания: За пределами статистического анализа

Современный искусственный интеллект, демонстрирующий впечатляющие способности в распознавании закономерностей, не обладает подлинным пониманием ментальных состояний — ключевого компонента так называемой “теории разума”. Хотя алгоритмы способны имитировать поведение, основанное на данных, они не способны к эмпатии, прогнозированию намерений или пониманию убеждений других агентов, не совпадающих с реальностью. Этот недостаток проявляется в неспособности систем адекватно реагировать на сложные социальные ситуации, требующие интерпретации неявных сигналов и понимания субъективных переживаний. Таким образом, несмотря на кажущуюся интеллектуальность, существующие модели остаются лишь статистическими инструментами, лишенными глубинного понимания, присущего сознательным существам.

Классический тест Салли-Энн, широко используемый в психологии развития для оценки способности понимать ложные убеждения, выявил существенные ограничения современных систем искусственного интеллекта. В этом тесте испытуемого просят предсказать, где будет искать предмет, который был перемещен в то время, когда другой персонаж ошибочно полагает, что он остался на прежнем месте. Неспособность ИИ последовательно и достоверно решать подобные задачи демонстрирует, что он не просто манипулирует символами, но и не обладает настоящим пониманием убеждений, намерений и перспектив других агентов. Это подчеркивает необходимость разработки принципиально новых подходов к созданию ИИ, которые выходят за рамки статистического анализа данных и включают в себя механизмы моделирования ментальных состояний, позволяющие не только предсказывать поведение, но и понимать его мотивацию.

Несмотря на впечатляющие возможности современных больших языковых моделей (LLM) в обработке и генерации текста, их способность к пониманию ментальных состояний остается ограниченной. Эти модели демонстрируют успех в распознавании закономерностей и статистических связей, но им не хватает способности к надежному, контекстно-зависимому рассуждению о намерениях, убеждениях и эмоциях других агентов. В отличие от людей, LLM не способны строить сложные модели мира, учитывающие субъективные переживания и перспективы других, что приводит к ошибкам в ситуациях, требующих понимания «теории разума». Ограниченность в интерпретации неявных сигналов и понимании скрытых мотивов существенно снижает эффективность LLM в задачах, требующих социального интеллекта и эмпатии, подчеркивая необходимость разработки принципиально новых подходов к искусственному интеллекту.

Психологические основы разумных агентов

Работы Джеффа Берда подчеркивают необходимость опоры искусственного интеллекта на проверенные принципы психологии, в особенности на механизмы, посредством которых люди понимают и предсказывают поведение других агентов. Этот подход предполагает, что для создания действительно интеллектуальных систем необходимо моделировать когнитивные процессы, лежащие в основе человеческого восприятия, обучения и принятия решений. Вместо разработки алгоритмов, основанных исключительно на статистических закономерностях, предлагается интегрировать знания о когнитивных искажениях, эвристиках и моделях мира, используемых человеком для интерпретации действий и намерений других. Такой подход позволит создавать ИИ, способный не только реагировать на текущие события, но и предвидеть вероятные действия, понимать скрытые мотивы и адаптироваться к изменяющимся обстоятельствам, что является ключевым аспектом социального интеллекта.

Обобщение признаков (Trait Generalization) представляет собой когнитивный процесс, позволяющий агентам выводить устойчивые характеристики объекта или субъекта и применять эти выводы в различных контекстах. Данный механизм критически важен для развития надежной Теории Разума (Theory of Mind), поскольку позволяет предсказывать поведение, основываясь не на конкретных действиях, а на предполагаемых внутренних качествах. Способность обобщать признаки позволяет агенту эффективно экстраполировать знания, полученные в одной ситуации, на новые, ранее не встречавшиеся сценарии, что существенно повышает адаптивность и эффективность взаимодействия с окружающим миром. Отсутствие или недостаточное развитие этого механизма приводит к сложностям в понимании намерений и прогнозировании действий других агентов.

Теория MindSpace предлагает альтернативный подход к моделированию ментальных представлений в искусственном интеллекте, отказываясь от представления о них как о дискретных категориях. Вместо этого, MindSpace постулирует, что ментальные представления организованы как континуумы, где понятия и характеристики располагаются вдоль непрерывных осей. Это позволяет более точно отразить градации и нюансы человеческого восприятия и суждений, избегая жестких границ между понятиями. В рамках данной теории, сходство между понятиями определяется их близостью в многомерном MindSpace, что позволяет системе более гибко обобщать знания и адаптироваться к новым ситуациям, учитывая степень сходства между ними. Применение континуальных представлений способствует созданию более реалистичных и эффективных моделей когнитивных процессов в ИИ.

Методологии моделирования социального познания

Исследования Мартена Сапа выявляют ограничения современных больших языковых моделей (LLM) в области индивидуальных, интерперсональных и культурных умозаключений — ключевого компонента теории разума (Theory of Mind). Существующие LLM демонстрируют недостаточную способность к моделированию знаний, убеждений и намерений отдельных личностей, а также к пониманию влияния социальных контекстов и культурных норм на поведение. Это проявляется в трудностях с корректным выводом о перспективе другого человека, предсказанием его действий на основе неявной информации и адекватной адаптацией к различным культурным особенностям. Работа Сапа направлена на разработку методов, позволяющих LLM более эффективно моделировать эти аспекты социального познания, что необходимо для создания более разумных и надежных искусственных агентов.

Проект Sotopia непосредственно исследует социальное выравнивание, фокусируясь на выводе знаний о публичной и приватной информации — способности агентов рассуждать о том, что другие знают и во что верят. Данный подход предполагает, что для эффективного взаимодействия с людьми, искусственный интеллект должен уметь различать информацию, доступную всем участникам коммуникации (публичное знание), и информацию, известную лишь отдельным индивидам (приватное знание). Исследование направлено на разработку алгоритмов, позволяющих агентам моделировать знания и убеждения других, учитывая контекст и доступную информацию, что является ключевым элементом для построения более реалистичных и эффективных систем искусственного интеллекта, способных к социальному взаимодействию.

Исследования Сарит Краус подчеркивают необходимость привлечения людей к процессу разработки искусственного интеллекта для обеспечения соблюдения этических норм и достижения взаимодополняющих преимуществ. Данный подход предполагает активное участие человека в обучении и корректировке моделей ИИ, что позволяет учитывать сложные социальные и этические нюансы, которые сложно запрограммировать напрямую. Вместо полной автоматизации, предлагается модель, в которой ИИ и человек совместно решают задачи, используя сильные стороны каждого: ИИ обеспечивает вычислительную мощность и анализ больших данных, а человек — критическое мышление, контекстуальное понимание и моральные ориентиры. Такой подход позволяет не только минимизировать риски, связанные с предвзятостью или нежелательными последствиями, но и создавать системы ИИ, которые эффективно взаимодействуют с людьми и приносят пользу обществу.

Развитие области: Коллективный подход

Мастерская ToM4AI выступает ключевой площадкой для исследователей, стремящихся обменяться знаниями и наладить сотрудничество на стыке теории разума и искусственного интеллекта. Ежегодное мероприятие, собравшее более ста участников, способствует развитию междисциплинарного диалога и позволяет совместно решать сложные задачи, связанные с моделированием когнитивных способностей в искусственных системах. Обмен опытом и результатами исследований, происходящий в рамках мастерской, стимулирует инновации и способствует созданию более совершенных и адаптивных алгоритмов искусственного интеллекта, способных к более эффективному взаимодействию с человеком и другими агентами.

Автономные агенты и многоагентные системы представляют собой плодородную почву для применения принципов теории сознания, открывая возможности для создания более реалистичных и эффективных взаимодействий с искусственным интеллектом. Исследования в этой области направлены на наделение агентов способностью моделировать ментальные состояния других агентов — их убеждения, намерения и знания. Это позволяет им предсказывать поведение, адаптироваться к изменяющимся обстоятельствам и эффективно сотрудничать или конкурировать. Разработка таких систем не ограничивается лишь технической реализацией; она требует глубокого понимания когнитивных процессов и социальной динамики, что способствует созданию ИИ, способного к более сложному и осмысленному взаимодействию с человеком и другими агентами.

Получение более шестидесяти заявок на участие в работе семинара свидетельствует о значительном и растущем интересе к исследованию теории разума в контексте искусственного интеллекта. Анализ представленных работ выявил любопытную закономерность: корреляция между различными аспектами работы одного и того же агента оказалась выше, чем корреляция между агентами, работающими над схожими задачами. Данный факт указывает на то, что исследователи в большей степени фокусируются на углублении понимания внутреннего мира и когнитивных процессов отдельных агентов, нежели на изучении взаимодействия между ними, что открывает перспективные направления для дальнейших исследований в области создания более сложных и адаптивных систем искусственного интеллекта.

В докладах второй конференции ToM4AI 2026 вновь обсуждают, как научить машины понимать, что у людей есть намерения. Как будто достаточно добавить ещё пару слоёв нейросети, и внезапно ИИ начнёт различать сарказм от искренней похвалы. Наивно полагают, что понимание «теории разума» решит все проблемы взаимодействия человека и ИИ. Тим Бернерс-Ли верно подметил: «Веб — это не просто куча связанных гипертекстовых документов, это способ думать». И вот сейчас, спустя десятилетия, пытаются «научить» машины думать, причём, судя по всему, теми же самыми примитивными способами, что и мы когда-то использовали, когда писали первые bash-скрипты. Не удивят, если через пару лет всё это назовут «социальным ИИ» и получат очередную волну инвестиций.

Что дальше?

Материалы второго семинара по развитию искусственного интеллекта через теорию разума (ToM4AI 2026) закономерно демонстрируют увлечение созданием машин, способных угадывать чужие намерения. Однако, каждое новое «понимание» человеческой социальности неизбежно порождает новый уровень абстракции, новый слой между алгоритмом и реальностью. Вскоре, вместо элегантной модели «понимания», возникнет очередная сложная система, требующая постоянного обслуживания и патчей — нечто вроде храма, где мы молимся, чтобы ничего не сломалось.

Вопрос не в том, сможет ли машина «понять» человека, а в том, как долго продлится иллюзия такого понимания. Этические соображения, обсуждаемые на семинаре, неизбежно окажутся погребены под лавиной новых функций и возможностей. Документация, как всегда, останется мифом, придуманным менеджерами, а реальное поведение системы будет определяться не декларациями, а оптимизацией под конкретные метрики.

Вполне вероятно, что следующее поколение «ToM-AI» будет посвящено не построению моделей разума, а разработке инструментов для обнаружения и исправления ошибок в этих моделях. Каждая «революционная» технология, как известно, завтра станет техдолгом. И в этом, пожалуй, заключается неизбежный закон развития искусственного интеллекта.

Оригинал статьи: https://arxiv.org/pdf/2603.18786.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-03-21 01:02

🚀 Квантовые новости