Разумный агент: Настройка поведения ИИ для эффективной работы с инструментами

Саморазвивающийся цикл данных и структура обучения для калибровки поведения совместно формируют основу ET-Agent, обеспечивая итеративное улучшение и адаптацию агента к изменяющимся условиям.

Новая методика позволяет обучать ИИ-агентов, использующих внешние инструменты, достигать оптимального баланса между точностью и скоростью выполнения задач.

Химические процессы: от идеи до симуляции за считанные часы

Разработка химических процессов традиционно требует значительных ручных усилий на всех этапах, в то время как существующие автоматизированные методы ограничиваются различными графическими представлениями, тогда как предлагаемый подход обеспечивает сквозную автоматизацию и охватывает различные измерения, выходя за рамки стандартных диаграмм технологических процессов [latex] (Douglas1988) [/latex] и используя гиперграфы с параметрическими аннотациями [latex] (Mannet al.2024) [/latex].

Новый подход объединяет возможности больших языковых моделей и многоагентных систем для автоматического создания рабочих химических процессов по текстовому описанию.

Когда всем хорошо: как учёт идиом улучшает машинный перевод

Методы GRPO-QE-\* различаются в подходе к семантическому пространству: QE-Positive сближает семантически эквивалентные тексты, QE-Negative отдаляет неэквивалентные, QE-Constrained стремится к балансу между этими процессами, а QE-DA использует эталонный перевод для уточнения оценки качества машинного перевода.

Новое исследование показывает, что обучение языковых моделей с использованием оценки качества перевода в качестве сигнала вознаграждения позволяет добиться значительного улучшения как в переводе идиом, так и в общей точности перевода на разные языки.

Где ‘разум’ в нейронных сетях? Новый взгляд на выравнивание языковых моделей

Исследование показывает, что способность больших языковых моделей соответствовать человеческим предпочтениям сосредоточена в последних слоях нейронной сети.

Лес за деревьями: новый подход к визуальному мышлению

Лазерная технология заменяет многословные текстовые обоснования [latex] (a) [/latex] эффективными латентными суперпозициями [latex] (b) [/latex], открывая путь к более компактному и производительному представлению информации.

Исследователи предлагают метод, позволяющий моделям видеть общую картину, а не только отдельные детали, что значительно повышает эффективность решения визуальных задач.

Интеллектуальный поиск материалов: как машинное обучение ускоряет открытия

В области поиска новых материалов, стратегии активного обучения используют как специализированные модели, итеративно переобучаемые на отобранных данных, так и масштабные предварительно обученные модели, позволяющие переносить знания между задачами, при этом функциональные режимы активного обучения фокусируются либо на отборе оптимальных кандидатов в известных областях дизайна, либо на исследовании новых химических пространств для открытия инновационных материалов, выходящих за рамки существующих статистических закономерностей.

В статье представлен обзор методов активного обучения, позволяющих значительно сократить время и ресурсы, необходимые для разработки новых материалов.