Языковые агенты: вдохновение от когнитивных моделей и алгоритмов ИИ

В статье рассматривается возможность использования проверенных когнитивных моделей и алгоритмов искусственного интеллекта в качестве шаблонов для создания более эффективных и понятных языковых агентов.

От слепых зон к новым возможностям: эволюция мультимодальных моделей

Предыдущие самообучающиеся системы, сталкиваясь с недостатком интерпретируемых диагностик и ограниченным разнообразием визуальных данных, лишь частично смягчают проблему галлюцинаций, оказываясь неэффективными при решении задач с длинным хвостом, таких как математические вычисления и оптическое распознавание символов, что приводит к нестабильности или даже деградации способностей модели в процессе эволюции, в то время как предложенный DPE-фреймворк успешно устраняет эти недостатки и обеспечивает более комплексное и сбалансированное развитие возможностей модели.

Исследователи предлагают новый подход к обучению больших мультимодальных моделей, направленный на выявление и устранение слабых мест для повышения эффективности и способности к рассуждению.

За гранью интеллекта: Математика действия и предвидения

Новая теория предлагает математический подход к пониманию различий между способностью предсказывать события и активным влиянием на них, открывая путь к созданию устойчивого искусственного интеллекта.

Визуальное мышление: воображение как ключ к пониманию

Визуальное рассуждение, осуществляемое посредством использования инструментов, таких как масштабирование или рисование, сопоставляется с подходом, использующим скрытые состояния мультимодальных языковых моделей для анализа визуальной информации, при этом исследование демонстрирует, что рассуждение, основанное на воображении в текстовом пространстве, может быть более эффективным.

Новое исследование показывает, что способность представлять образы играет важную роль в решении визуальных задач, но существующие подходы к «скрытому» визуальному мышлению пока не используют этот потенциал в полной мере.

Как ученые используют искусственный интеллект: новый взгляд на взаимодействие

Интерфейсы Asta, использованные в исследовании (Singh и др., 2025; Allen Institute for Artificial Intelligence, 2025), демонстрируют различные способы взаимодействия с системой, что позволяет оценить эффективность и удобство использования различных подходов к организации пользовательского опыта.

Исследование представляет масштабный набор данных, отражающий реальный опыт взаимодействия исследователей с ИИ-помощниками в научной работе.

Искать больше, думать меньше: Новый подход к поиску информации

Исследователи предлагают отказаться от сложного последовательного анализа в пользу параллельного сбора данных и эффективного управления контекстом для решения задач, требующих долгосрочного планирования.

Язык науки: как ИИ открывает физические законы в материалах

В рамках разработанной системы LangLaw, большая языковая модель выступает в роли агента, анализирующего данные и генерирующего ограничения для символьной регрессии, при этом отобранные формулы и метрики их производительности накапливаются в библиотеке, формируя опыт, который, в свою очередь, уточняет стратегию поиска на последующих итерациях, создавая замкнутый цикл самообучения и оптимизации [latex] \text{формула = f(данные, опыт)} [/latex].

Новый подход, объединяющий возможности искусственного интеллекта и символьной регрессии, позволяет извлекать понятные физические формулы из сложных данных о материалах.

Оживляя движения: новые модели для генерации реалистичной анимации

Предложенная схема CMDM, состоящая из кодировщика MAC-VAE, каузального модуля DiT и метода принудительного каузального диффузного процесса, обеспечивает генерацию согласованных во времени и семантически выверенных движений из текста, используя каузальную структуру для кодирования последовательностей движения и последующего уточнения кадров с помощью диффузии, что позволяет достичь эффективного синтеза движений для потоковой передачи и долгосрочного планирования.

Исследователи предлагают инновационный подход к созданию правдоподобных движений из текстовых описаний, сочетающий в себе причинные диффузионные модели и авторегрессивное моделирование.