Самообучающиеся агенты: новый подход к развитию навыков в обучении с подкреплением

Система ARISE, развернутая на модели Qwen3-4B, демонстрирует свою эффективность на семи различных бенчмарках, динамично наращивая награду в процессе обучения на DeepScaleR, эффективно используя приобретенные навыки и достигая прироста точности при умеренном увеличении объема токенов относительно GRPO.

Исследователи представили ARISE — инновационную систему, позволяющую агентам самостоятельно развивать и совершенствовать навыки для решения сложных задач, в частности, в области математического рассуждения.

Машины учатся отличать гениальные идеи от проходных

Новое исследование показывает, что искусственный интеллект способен формировать «научный вкус» и оценивать перспективность исследований, анализируя историю публикаций.

Двойственность остаточных потоков в современных трансформерах

Новое исследование раскрывает математическую эквивалентность глубинной остаточной внимания и алгоритма ShortSWA, предлагая пути повышения эффективности и производительности моделей.

Искусственный интеллект в юриспруденции: опасности невидимых ошибок

Новые системы генеративного ИИ в правовой сфере несут в себе риски фабрикации информации и чрезмерного доверия со стороны специалистов, что ставит под вопрос прозрачность и обоснованность юридических решений.

Мир в Объединении: Генерация 3D-сцен нового поколения

OneWorld генерирует трехмерную графику из одного изображения и рендерит новые виды, в отличие от подходов, таких как FlashWorld и Gen3R, которые либо используют сжатие видеоданных, либо разделяют генерацию геометрии и внешнего вида; OneWorld осуществляет генерацию напрямую в едином трехмерном пространстве без сжатия или разделения, что подтверждается сравнительным анализом на WorldScore и DL3DV.

Новая модель OneWorld позволяет создавать реалистичные и согласованные трехмерные сцены напрямую в едином 3D-пространстве, обходя ограничения традиционных 2D-подходов.

Трансформеры без тормозов: новая стратегия адаптации Vision Transformers

Модель ViT-AdaLA адаптируется в три этапа: выравнивание внимания, выравнивание признаков и контролируемая тонкая настройка, причём начальный этап ограничивается настройкой лишь линейных модулей внимания, второй - смягчает накапливающиеся ошибки приближения путём сопоставления представлений последнего слоя с оригинальной моделью на основе softmax, а заключительный - переносит полученные знания на решение конкретных задач.

Исследователи предложили ViT-AdaLA — метод, позволяющий эффективно переносить знания из предобученных Vision Transformers в модели с линейным вниманием, не теряя в производительности.

Физика и Искусственный Интеллект: Новый Подход к Научному Анализу

Исследователи представили OMNIFLOW — систему, объединяющую мощь языковых моделей с фундаментальными законами физики для решения сложных научных задач.

Поиск по фармацевтическим данным: новый взгляд с помощью искусственного интеллекта

Архитектура Finder представляет собой сложную экосистему компонентов, где каждый элемент, подобно пророчеству, определяет потенциальные точки отказа в будущем, а не просто выступает в качестве инструмента для решения текущей задачи.

В статье представлена инновационная система, позволяющая эффективно извлекать знания из разнородных источников фармацевтических данных.