Самообучающийся агент для решения задач, объединяющих зрение и язык

Агент0-VL демонстрирует превосходство над существующими методами логических рассуждений с использованием инструментов благодаря итеративному процессу самосовершенствования, в котором решатель последовательно уточняет стратегии рассуждений на основе обратной связи от верификатора, что подтверждается результатами на различных эталонных задачах.

Новая разработка демонстрирует способность к непрерывному улучшению навыков рассуждения за счет самоэволюции и использования внешних инструментов.

Скрытое взаимодействие: новые горизонты для многоагентных систем

Система LatentMAS обеспечивает всестороннее взаимодействие между языковыми моделями, за счёт генерации скрытых представлений на основе состояний скрытых слоёв и обмена информацией через общую, совместно используемую память в KV-кэшах, что позволяет агентам координировать действия на системном уровне.

Исследователи предлагают принципиально новый подход к организации взаимодействия между агентами, основанный на использовании скрытого пространства больших языковых моделей.

Виртуальные миры для обучения роботов: новый подход к созданию данных

Визуализация результатов проекта GigaWorld-0-Video-MimicTransfer демонстрирует возможность преобразования видеозаписей манипуляций, выполненных человеком от первого лица, в траектории, пригодные для исполнения роботом, что обеспечивает масштабируемый синтез данных для обучения моделей VLA в условиях кросс-воплощения.

Исследователи представили GigaWorld-0 — платформу, генерирующую реалистичные виртуальные среды для эффективного обучения агентов, взаимодействующих с физическим миром.

Молекулярный конструктор: Искусственный интеллект на службе создания лекарств

Система FRAGMENTA демонстрирует эволюцию от традиционного подхода, требующего непосредственного участия химиков-медиков и инженеров по искусственному интеллекту, к полуавтономной среде, где агентурная основа заменяет роль инженера, и, наконец, к полностью автономной системе, где обе функции автоматизированы, отражая переход к самоорганизующимся экосистемам разработки лекарств.

Новая модель FRAGMENTA объединяет фрагментный подход к проектированию молекул с самообучающимся агентом, значительно ускоряя поиск перспективных кандидатов в лекарственные препараты.

Голоса писателей: Искусственный интеллект воссоздает стиль XIX века

На рисунке демонстрируется оценка стиля генерируемых предложений, где сравниваются результаты двух моделей - FFT и LoRA, причем акцент сделан на анализе исключительно выходных данных модели FFT для выявления особенностей ее лингвистических характеристик.

Новое исследование показывает, как современные языковые модели могут быть обучены имитировать манеру письма классических романистов, используя лишь минимальные подсказки.

Учитель и ИИ: На пути к взаимовыгодному сотрудничеству

Взаимодействие искусственного интеллекта и педагога строится не на слепом выполнении указаний, а на критическом обмене мнениями: система, анализируя контекст обучения, не просто предоставляет обратную связь, но и аргументированно оспаривает предложения учителя, совместно итеративно приходя к согласованному решению, что позволяет достичь более глубокого понимания и оптимальной стратегии обучения, где $AI \leftrightarrow Teacher$ является динамическим процессом, а не односторонней корректировкой.

Новая статья рассматривает перспективы объединения педагогического опыта и возможностей генеративного искусственного интеллекта для создания более эффективной и персонализированной образовательной среды.

Визуальный интеллект: обучение моделей сложным задачам с инструментами

Непосредственное расширение визуально-языковых моделей инструментами значительно снижает точность, в то время как внутренние рассуждения дают ограниченный прирост в решении сложных задач визуального вопросно-ответного типа; однако, предоставление предварительных знаний о выборе инструментов и чередование рассуждений с выполнением действий позволяет улучшить результаты, причём прирост зависит от конкретной задачи и масштаба модели - коммерческие модели демонстрируют переменный успех, а небольшие модели с открытым исходным кодом остаются особенно уязвимыми.

Новая платформа VISTA-Gym позволяет обучать мультимодальные модели рассуждать и действовать в сложных визуальных сценариях, используя внешние инструменты.

Аналогии в машинном разуме: как большие языковые модели учатся сопоставлять

Большие языковые модели эффективно кодируют и применяют реляционные связи при аналоговом мышлении, однако успешное применение этих связей зачастую сталкивается с теми же ограничениями, что и их первоначальное кодирование, при этом выявление аналогичных ситуаций тесно связано со структурным выравниванием, количественно оцениваемым с помощью показателя взаимного выравнивания (MAS).

Новое исследование проливает свет на внутренние механизмы, позволяющие современным нейросетям решать задачи, требующие понимания аналогий и установления связей между концепциями.