Искусственный интеллект: Стремление к идеалу или отражение реальности?

В исследовании, охватившем четыре семейства игр, базовые модели демонстрируют превосходство над выстроенными в соответствии с человеческими предпочтениями, побеждая в соотношении 9.7:1 (213 против 22, [latex] p<10^{-{40}} [/latex]), при этом значительная часть пар моделей показывает низкую корреляцию с человеческим поведением (ниже 0.3).

Новое исследование показывает, что настройка больших языковых моделей на соответствие человеческим предпочтениям снижает их способность предсказывать поведение людей в стратегических ситуациях.

Медицинские изображения и интеллект: новый подход к адаптации моделей

В рамках исследования предложена архитектура ACE-LoRA, интегрирующая модули адаптации низкого ранга в блоки самовнимания кодировщиков изображений и текста в обобщенной медицинской VLM, при этом для моделирования зависимостей высшего порядка между локальными и глобальными представлениями используется гиперграфовый модуль ACE-HGNN, применяемый как к изображениям, так и к текстовым данным.

Исследователи предлагают эффективный метод дообучения моделей, работающих с медицинскими изображениями и текстом, позволяющий добиться высокой точности без значительных вычислительных затрат.

Эволюция разума: Агент, который учится и развивается в реальном времени

Предлагаемая система совершенствует мета-модель [latex]\mathcal{M}=(\theta, \mathcal{S})[/latex] посредством двух взаимодополняющих циклов, работающих в различных временных масштабах: быстрой адаптации, основанной на навыках, анализирующей неудачные траектории и мгновенно расширяющей библиотеку навыков [latex]\mathcal{S}[/latex] без обновления параметров, и оптимизации политики, аккумулирующей пост-адаптационные траектории и, при наличии достаточного объема данных, использующей сигналы простоя (сон, бездействие, календарь) для инициирования обновления весов θ посредством тонкой настройки Cloud LoRA.

Новая система MetaClaw демонстрирует способность языковых агентов к непрерывному обучению и адаптации в динамичной среде, открывая путь к действительно автономным ИИ.

Искусственный ученый: как масштабировать задачи для обучения ИИ

Автоматизированный процесс генерации задач машинного обучения, не требующий вмешательства человека, включает в себя отбор тем и предложенные наборы данных, а также механизм отладки для устранения возникающих проблем, что позволяет избежать отбраковки задачи и обеспечивает её дальнейшую реализацию.

Новый подход позволяет создавать синтетические исследовательские задачи и наборы данных, обучая ИИ-агентов самостоятельно проводить научные открытия.

Видеореальность без границ: новая память для умных машин

Гибридный подход MosaicMem объединяет преимущества явной и неявной памяти, демонстрируя повышенную точность отслеживания движения камеры по сравнению с неявной памятью и, в отличие от явной памяти, позволяя генерировать динамичные, управляемые текстом сцены.

Исследователи разработали инновационный подход к запоминанию визуальной информации, позволяющий создавать реалистичные и управляемые видеоролики с высокой степенью согласованности.

Внутренний мир языковых моделей: как сохранить знания в процессе обучения

Новое исследование раскрывает, как оптимизировать процесс обучения больших языковых моделей, чтобы улучшить их способность к рассуждениям и повысить эффективность обучения с подкреплением.

Самообучающиеся агенты: новый подход к развитию навыков в обучении с подкреплением

Система ARISE, развернутая на модели Qwen3-4B, демонстрирует свою эффективность на семи различных бенчмарках, динамично наращивая награду в процессе обучения на DeepScaleR, эффективно используя приобретенные навыки и достигая прироста точности при умеренном увеличении объема токенов относительно GRPO.

Исследователи представили ARISE — инновационную систему, позволяющую агентам самостоятельно развивать и совершенствовать навыки для решения сложных задач, в частности, в области математического рассуждения.