Машины учатся отличать гениальные идеи от проходных

Новое исследование показывает, что искусственный интеллект способен формировать «научный вкус» и оценивать перспективность исследований, анализируя историю публикаций.

Самообучающиеся агенты: новый подход к развитию навыков в обучении с подкреплением

Система ARISE, развернутая на модели Qwen3-4B, демонстрирует свою эффективность на семи различных бенчмарках, динамично наращивая награду в процессе обучения на DeepScaleR, эффективно используя приобретенные навыки и достигая прироста точности при умеренном увеличении объема токенов относительно GRPO.

Исследователи представили ARISE — инновационную систему, позволяющую агентам самостоятельно развивать и совершенствовать навыки для решения сложных задач, в частности, в области математического рассуждения.

Внимание без излишеств: к упрощению архитектур больших языковых моделей

Парадигма QV демонстрирует, что качество зрения (QV) является ключевым фактором, определяющим производительность системы, и может быть оптимизировано для достижения наилучших результатов.

Новое исследование предлагает переосмысление механизма внимания, демонстрируя, что для достижения сопоставимой производительности достаточно упрощенной модели, отказавшись от части избыточности.

Искусственный интеллект в юриспруденции: опасности невидимых ошибок

Новые системы генеративного ИИ в правовой сфере несут в себе риски фабрикации информации и чрезмерного доверия со стороны специалистов, что ставит под вопрос прозрачность и обоснованность юридических решений.

Двойственность остаточных потоков в современных трансформерах

Новое исследование раскрывает математическую эквивалентность глубинной остаточной внимания и алгоритма ShortSWA, предлагая пути повышения эффективности и производительности моделей.

Мир в Объединении: Генерация 3D-сцен нового поколения

OneWorld генерирует трехмерную графику из одного изображения и рендерит новые виды, в отличие от подходов, таких как FlashWorld и Gen3R, которые либо используют сжатие видеоданных, либо разделяют генерацию геометрии и внешнего вида; OneWorld осуществляет генерацию напрямую в едином трехмерном пространстве без сжатия или разделения, что подтверждается сравнительным анализом на WorldScore и DL3DV.

Новая модель OneWorld позволяет создавать реалистичные и согласованные трехмерные сцены напрямую в едином 3D-пространстве, обходя ограничения традиционных 2D-подходов.

Восстановление электронной структуры материалов с помощью машинного обучения

Исследование структуры [latex]Nd_{1-x}Sr_xNiO_3[/latex] и электронной конфигурации никеля позволило разработать модель SIREN, состоящую из пяти скрытых слоёв, которая, используя параметры тёсных связей и вектор <b>k</b>, предсказывает спектральную интенсивность [latex]IML[/latex] с точностью, сравнимой с результатами, полученными традиционной моделью тёсных связей, что демонстрирует потенциал машинного обучения в материаловедении.

Новый подход позволяет автоматически извлекать ключевые параметры из данных спектроскопии фотоэмиссии, открывая путь к более быстрому анализу квантовых материалов.

Параллельные вычисления: новый взгляд на оптимизацию и динамические системы

В статье представлен инновационный подход к распараллеливанию последовательных вычислений, особенно актуальный для современных моделей машинного обучения.