Алгебраическое мышление: новый подход к решению задач абстрактного разума

Автор: Денис Аветисян


Исследователи предлагают инновационную систему искусственного интеллекта, использующую векторные символические алгебры для моделирования когнитивных процессов и решения сложных задач, подобных тем, что встречаются в тесте ARC-AGI.

🚀 Квантовые новости

Подключайся к потоку квантовых мемов, теорий и откровений из параллельной вселенной.
Только сингулярные инсайты — никакой скуки.

Присоединиться к каналу
Представления объектов, полученные в ходе демонстрации задачи ARC-AGI, кодируются с использованием 1024-мерных векторов, при этом сходство цветового представления объекта с десятью возможными цветовыми векторами, а также сходство представления центра и формы объекта с кодировкой SSP каждой позиции в сетке, демонстрируют внутреннюю структуру данных и позволяют установить соответствия в двухмерном пространстве.
Представления объектов, полученные в ходе демонстрации задачи ARC-AGI, кодируются с использованием 1024-мерных векторов, при этом сходство цветового представления объекта с десятью возможными цветовыми векторами, а также сходство представления центра и формы объекта с кодировкой SSP каждой позиции в сетке, демонстрируют внутреннюю структуру данных и позволяют установить соответствия в двухмерном пространстве.

В статье представлен нейросимволический решатель для бенчмарка Abstraction and Reasoning Corpus (ARC-AGI), использующий векторные символические алгебры для объектно-ориентированного представления и синтеза программ.

Несмотря на впечатляющие успехи в области искусственного интеллекта, задачи, требующие абстрактного мышления и обобщения, остаются сложной проблемой. В данной работе, ‘Vector Symbolic Algebras for the Abstraction and Reasoning Corpus’, предлагается новый подход к решению Корпуса Абстракции и Рассуждений (ARC-AGI), основанный на использовании векторных символических алгебр (VSAs) и нейросимволических методов. Предложенное решение объединяет интуитивные и логические процессы, осуществляя объектно-ориентированный синтез программ для эффективного решения абстрактных задач. Способны ли такие когнитивно правдоподобные системы приблизить нас к созданию действительно общего искусственного интеллекта?


Ограничения Логического Вывода в Больших Языковых Моделях

Крупные языковые модели демонстрируют впечатляющие возможности, однако часто испытывают трудности в решении сложных задач, требующих логических рассуждений. Это указывает на фундаментальные ограничения, заложенные в их базовой архитектуре, несмотря на масштабирование параметров и объемов данных. Модели могут проявлять излишнюю уверенность в своих предсказаниях и демонстрировать плохую калибровку, что снижает доверие к ним в критических приложениях. Неверная калибровка возникает из-за несоответствия между предсказанными вероятностями и фактической корректностью, препятствуя широкому внедрению. Сложность алгоритма определяется его масштабируемостью и асимптотической устойчивостью, а не объемом кода.

Элицитация Рассуждений: Метод Chain-of-Thought

Метод Chain-of-Thought (CoT) представляет собой перспективный подход к улучшению рассуждений больших языковых моделей, стимулируя генерацию промежуточных этапов рассуждений перед выдачей ответа. Явное представление процесса мышления обеспечивает большую прозрачность и интерпретируемость. В отличие от традиционных подходов, CoT позволяет проследить логическую цепочку, приведшую к результату. Эффективность CoT напрямую зависит от качества промптов и инженерного подхода к их разработке. Тщательно сформулированные промпты, направляющие модель к последовательному изложению рассуждений, существенно влияют на производительность в задачах, требующих логического мышления.

Постобработка для Улучшения Калибровки

После обучения модели машинного обучения часто наблюдается несоответствие между предсказанными вероятностями и фактической точностью, известное как неправильная калибровка. Это может приводить к недооценке или переоценке рисков. Для решения этой проблемы применяются методы постобработки, такие как Temperature Scaling, который не требует переобучения модели или изменения ее архитектуры. Temperature Scaling калибрует выходные вероятности путем деления логитов на параметр температуры, оптимизируемый на валидационном наборе данных. Это позволяет скорректировать уверенность модели, приближая предсказанные вероятности к фактическим частотам событий, что особенно полезно в задачах, где важна не только точность предсказания, но и оценка степени уверенности в нем.

Оценка Калибровки в Различных Условиях Обучения

Проведена оценка калибровки больших языковых моделей в условиях zero-shot и few-shot обучения для анализа их обобщающей способности. В качестве ключевой метрики использовалась ожидаемая ошибка калибровки (ECE). Эффективность применения метода температурной шкалы (Temperature Scaling) для улучшения калибровки также была тщательно проанализирована. Полученные результаты демонстрируют, что разработанный нейросимволический решатель ARC-AGI достигает точности 10.8% на ARC-AGI-1-Train и 3.0% на ARC-AGI-1-Eval, что свидетельствует о значительном прогрессе в решении сложных задач логического вывода. Истинная уверенность в решении всегда превышает кажущуюся точность на тестовых примерах.

Исследование, представленное в статье, демонстрирует элегантность подхода, основанного на векторных символьных алгебрах (ВСА), к решению задач абстрактного рассуждения. Система, использующая ВСА для объектно-ориентированного представления, стремится к когнитивной правдоподобности, что соответствует стремлению к математической чистоте алгоритмов. Как однажды заметил Джон Маккарти: «Искусственный интеллект – это изучение того, как сделать машины, чтобы они делали то, что сейчас требует интеллекта от человека.» Этот принцип находит свое отражение в создании системы, способной не просто решать задачи, но и делать это способом, напоминающим человеческое мышление, что особенно важно при работе с бенчмарком ARC-AGI.

Куда двигаться дальше?

Представленная работа, безусловно, демонстрирует потенциал векторных символьных алгебр (ВСА) в контексте задач, требующих абстрактного мышления. Однако, не стоит забывать, что успешное прохождение бенчмарка ARC-AGI – это лишь первый шаг. Важно помнить, что оптимизация без анализа – это самообман и ловушка для неосторожного разработчика. Реальная проверка подхода заключается в его способности к обобщению, то есть решению принципиально новых задач, выходящих за рамки предопределенного набора примеров.

Очевидным направлением дальнейших исследований является углубление понимания когнитивной правдоподобности ВСА. Простое воспроизведение результатов не означает, что система действительно мыслит аналогично человеку. Необходимо разработать более строгие критерии оценки «похожести» на человеческое мышление, возможно, опираясь на данные нейрофизиологических исследований. Кроме того, следует исследовать возможности интеграции ВСА с другими подходами в области нейросимволического искусственного интеллекта, например, с байесовскими сетями или логическими исчислениями.

В конечном счете, вопрос заключается не в том, насколько хорошо система решает задачи ARC-AGI, а в том, насколько элегантно и эффективно она представляет знания и выполняет умозаключения. Истинная элегантность кода проявляется в его математической чистоте. Разработка алгоритмов, которые можно строго доказать, а не просто протестировать, остается главной задачей для исследователей в этой области.


Оригинал статьи: https://arxiv.org/pdf/2511.08747.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2025-11-13 11:56