Обучение языковых моделей понимать 3D-мир: исправление ошибок как ключ к успеху

Целенаправленные визуальные правки, представленные в работе, позволяют создавать согласованные пары вопросов и ответов, что обеспечивает точное обучение модели способности к визуальному сопоставлению и пониманию.

Новый подход позволяет значительно улучшить способность больших языковых моделей к пониманию и взаимодействию с трехмерными сценами, фокусируясь на автоматическом исправлении собственных ошибок.

Искусственный интеллект в роли ученого: проверка на прочность

Новое исследование оценивает способность автономной системы искусственного интеллекта KOSMOS самостоятельно выдвигать и проверять научные гипотезы в области радиобиологии.

Искусственный интеллект на службе музыки: от анализа до обучения

Агент по анализу музыки представляет собой систему, способную к деконструкции музыкальных композиций, выявляя закономерности и структуру, подобно реверс-инжинирингу сложного механизма, и предлагая новые способы понимания и манипулирования звуком.

В статье представлен обзор современных подходов искусственного интеллекта к анализу музыкальных произведений и их применению в образовательном процессе.

Пространственный интеллект: новая эра 3D-понимания и генерации

Модель Part-X-MLLM, изначально трёхмерная и обладающая пониманием частей объектов, обеспечивает всесторонний анализ трёхмерных форм и поддерживает широкий спектр задач, связанных с трёхмерным пониманием, а также беспрепятственно интегрируется с диффузионными пайплайнами для семантически точной генерации и редактирования трёхмерных форм с учётом их составных частей.

Исследователи представили модель, способную к точному управлению и манипулированию 3D-объектами, рассматривая взаимодействие с ними как исполняемые программы.

Искусственный интеллект и человеческий разум: новый виток зависимости?

Масштабное международное исследование выявило растущую склонность людей полагаться на решения, предложенные искусственным интеллектом, и связанные с этим риски.

Самообучающиеся агенты для разработки: эволюция в реальном времени

Агент Live-SWE обеспечивает комплексный обзор динамических процессов, позволяя отслеживать и анализировать изменения в реальном времени.

Новый подход позволяет программным агентам самостоятельно расширять свои возможности, создавая инструменты прямо в процессе работы над задачами.

Искусственный интеллект: что скрывается за способностью рассуждать?

Новая работа предлагает взглянуть на ‘рассуждения’ языковых моделей как на форму логического вывода, основанную на выявлении инвариантных закономерностей.

Справедливость ИИ: когда данные о людях неполны

Разработана таксономия общепринятых методов повышения справедливости алгоритмов в условиях неполной информации о демографических данных, что позволяет систематизировать и анализировать подходы к смягчению предвзятости при ограниченном доступе к чувствительным атрибутам.

В статье рассматриваются современные подходы к обеспечению справедливости в системах искусственного интеллекта при неполноте или отсутствии демографических данных.