Разум машин: объединяя нейросети и символьные вычисления
![Расширенная нейро-символическая архитектура обеспечивает одновременное обучение как нейронными сетями, так и символьными системами: прямой вывод ([latex]deduce()[/latex] методы нейронного и символьного модулей, соединённые через транслятор) формирует предсказания, в то время как нейронная индукция (обучение нейронного модуля посредством обратного распространения ошибки, основанного на абдуктивных сигналах от символьного модуля) и символическая индукция (добавление новых правил в политику символьного модуля через его метод [latex]induce()[/latex] во время эволюционных мутаций) обеспечивают адаптацию и обогащение знаний системы.](https://arxiv.org/html/2601.04799v1/x2.png)
Новый подход позволяет обучать системы, способные к логическому мышлению и адаптации, без необходимости в заранее заданных знаниях или градиентной оптимизации.
![Расширенная нейро-символическая архитектура обеспечивает одновременное обучение как нейронными сетями, так и символьными системами: прямой вывод ([latex]deduce()[/latex] методы нейронного и символьного модулей, соединённые через транслятор) формирует предсказания, в то время как нейронная индукция (обучение нейронного модуля посредством обратного распространения ошибки, основанного на абдуктивных сигналах от символьного модуля) и символическая индукция (добавление новых правил в политику символьного модуля через его метод [latex]induce()[/latex] во время эволюционных мутаций) обеспечивают адаптацию и обогащение знаний системы.](https://arxiv.org/html/2601.04799v1/x2.png)
Новый подход позволяет обучать системы, способные к логическому мышлению и адаптации, без необходимости в заранее заданных знаниях или градиентной оптимизации.
Новое исследование углубляется в механизмы логического вывода у моделей обработки естественного языка, проверяя, насколько последовательны их умозаключения.

Новое исследование показывает, что в моделях Mixture-of-Experts формируется небольшая группа экспертов, обрабатывающая основную часть задач, независимо от входных данных.

Новое исследование показывает, что даже небольшие изменения в ключевых словах могут заставить современные модели «зрение-язык» генерировать опасный контент.

Новое исследование показывает, что современные языковые модели способны с одинаковой эффективностью убеждать людей в правдивости теорий заговора и опровергать их.

Новый подход GDPO решает проблему нестабильности обучения в задачах с множественными наградами, обеспечивая лучшее согласование языковых моделей с разнообразными предпочтениями пользователей.

В статье описывается успешное применение ChatGPT для ускорения научных прототипов в соревновании ESA ELOPE, демонстрируя потенциал ИИ как инструмента для совместной работы с учеными.
![В основе разработанной системы генерации видео, PlenopticDreamer, лежит авторегрессивная модель, использующая банк пар [latex]\left(\mathbf{P}^{n},\mathbf{V}^{n}\right)\_{n=1}^{k}[/latex], отобранных на основе 3D поля зрения, для последовательного воссоздания видеофрагментов [latex]\mathbf{V}^{k+1}[/latex] при заданном ракурсе камеры [latex]\mathbf{P}^{k+1}[/latex], при этом для обеспечения непрерывности и качества генерации часть предыдущих кадров сохраняется в качестве исходных данных, а внутри каждого блока DiT применяется временная конкатенация для формирования видеотокенов в качестве контекстных условий.](https://arxiv.org/html/2601.05239v1/x2.png)
Новая разработка позволяет создавать динамичные видео с полным контролем над камерой и бесшовной сменой точек обзора.

Новое исследование показывает, что агенты с развитыми навыками могут эффективно выполнять задачи, ранее требовавшие координации множества ИИ, но их возможности ограничены.
![Система VideoAuto-R1 функционирует по принципу «одна мысль - два ответа», где как первоначальный, так и пересмотренный ответ оцениваются с помощью проверяемых вознаграждений, а механизм раннего выхода позволяет динамически определять необходимость углубленного рассуждения [latex]CoT[/latex] в процессе инференса.](https://arxiv.org/html/2601.05175v1/x1.png)
Новая модель позволяет искусственному интеллекту эффективно анализировать видео, применяя сложные рассуждения только при необходимости.