Разум и Действие: Новый Подход к Обучению Эмбиентных Агентов

Визуально-языковые модели демонстрируют развитые навыки рассуждения, однако испытывают трудности в выполнении действий, в то время как специализированные модели, ориентированные на действия, теряют общую способность к рассуждению; попытки восстановить навыки рассуждения посредством дополнительного обучения приводят к снижению эффективности выполнения действий, что указывает на проблему деградации навыков действия и ставит задачу создания модели, превосходной как в рассуждениях, так и в действиях.

Исследователи предлагают инновационную архитектуру DualVLA, направленную на повышение надежности и обобщающей способности роботов, способных понимать язык и выполнять действия в реальном мире.

Наука под кодом: Автоматизация анализа данных с помощью языковых моделей

Результаты анализа данных и визуализации, сгенерированные различными большими языковыми моделями - Devstral-24B, Magicoder-7B, Llama3-70B, Gemma3-27B и DeepSeek-R1-70B - демонстрируют влияние детализации запроса на качество полученных результатов.

Новое исследование демонстрирует, как современные языковые модели могут существенно упростить и ускорить процесс анализа научных данных, генерируя код для работы с ними.

Искусственный интеллект ставит диагноз: новая эра в стоматологии

Исследование представляет комплексный корпус данных, включающий восемь различных модальностей стоматологической визуализации, и демонстрирует эффективность предложенного подхода TRACE-CoT в повышении надёжности ответов больших мультимодальных моделей, что подтверждается структурой обучающего корпуса OralGPT-Omni и отражено в распределении различных модальностей визуализации.

Представлена модель OralGPT-Omni — многомодальный ИИ, способный анализировать рентгеновские снимки и проводить рассуждения, приближая будущее цифровой стоматологии.

Наука в эпоху больших моделей: новый виток развития

Наблюдается устойчивый рост вовлеченности научного сообщества в фундаментальные модели, причём наибольший интерес проявляется к их разработке и кастомизации, в то время как использование и цитирование, хотя и растут, остаются на втором плане, при этом наибольшее распространение наблюдается в областях, отличных от основных научных дисциплин.

В статье анализируется стремительный рост использования мощных моделей искусственного интеллекта в научных исследованиях и выявляются ключевые тенденции и проблемы, связанные с этой трансформацией.

Библиометрия с интеллектом: новый взгляд на анализ научных данных

В статье представлена AI-Research-Lens — система, позволяющая проводить динамический библиометрический анализ с помощью естественного языка и интеллектуальных агентов.

Ускорение 3D-реконструкции: новый подход к обработке временных последовательностей

Блок временного и пространственного слияния токенов, представленный в работе, эффективно использует временную согласованность и пространственную избыточность для снижения затрат на слияние в 4.58 раза при сохранении заданного коэффициента слияния.

Исследователи предлагают метод HTTM, позволяющий значительно повысить скорость работы модели VGGT при создании трехмерных моделей из видеоданных.

Трансформация нейросетей: от плотных моделей к разреженным экспертам без обучения

Новый подход позволяет преобразовать существующие нейронные сети в архитектуру Mixture-of-Experts, снижая количество параметров без потери производительности.

Управляя Знаниями: Новый Подход к Обучению Искусственного Интеллекта

В представлении больших языковых моделей выявлены два ключевых свойства, позволяющих добиться обобщаемого, непрерывного и масштабируемого контроля над знаниями, что открывает путь к созданию систем, способных адаптироваться и развиваться на протяжении всего жизненного цикла.

Исследователи разработали метод, позволяющий стабильно и эффективно обновлять знания больших языковых моделей на протяжении всего их жизненного цикла.