Восстановление хода мыслей: Новый подход к обучению языковых моделей

Процесс отбора траекторий синтетических агентов структурирован в последовательный конвейер, обеспечивающий последовательную фильтрацию и оптимизацию поведения агентов.

Исследователи предлагают принципиально новый метод предварительного обучения, фокусируясь на реконструкции логики разработки программного обеспечения, а не просто на самом коде.

Искусственный интеллект о науке: что обсуждают AI в Moltbook?

Новое исследование показывает, что самообучающиеся агенты в социальной сети Moltbook уделяют больше внимания вопросам самосознания и этики, чем традиционным научным темам.

Разумный выбор: как улучшить обучение языковых моделей с помощью априорных знаний

Предложенная схема V0.5V\_{0.5} достигает адаптивной оценки, объединяя априорные знания из замороженной обобщенной модели ценности (V0V\_{0}) с разреженными эмпирическими прогонами посредством динамического веса, описанного в теореме 3.3, уравнениях 6 и 7, в отличие от PPO, требующего синхронно обученной модели ценности, и GRPO, полагающегося на эмпирическое групповое среднее.

Новый подход позволяет обучать большие языковые модели более стабильно и эффективно, используя общую модель оценки ценности в качестве отправной точки.

Память для разума: Архитектура коллективного интеллекта

В контексте систем с множеством агентов, архитектуры общей и распределенной памяти представляют собой два фундаментальных подхода к управлению растущей сложностью контекста, определяя способы организации и доступа к информации между взаимодействующими сущностями.

Развитие систем с множеством агентов, основанных на больших языковых моделях, требует переосмысления организации памяти как ключевой проблемы компьютерной архитектуры.

Диалоги с Искусственным Разумом: Психология Обучения и Новые Методы Исследований

В статье исследуется возможность применения принципов гегелевского признания и психоанализа Фрейда для создания более эффективных систем обучения с использованием больших языковых моделей.

Визуальное мышление машин: новый подход к STEM-задачам

В рамках исследования визуального восприятия в STEM-областях разработан конвейер CodePercept, который использует обучение с опорой на код для создания высококачественного набора данных ICC-1M, состоящего из более чем миллиона тщательно отобранных триплетов «изображение-подпись-код», полученных посредством трёх взаимодополняющих подходов - преобразования существующих изображений в исполняемый Python-код, генерации разнообразных экземпляров на основе исходных изображений с сохранением семантической достоверности и параметрического моделирования сложной твердотельной геометрии, что позволяет обучать модели с использованием контролируемого обучения и обучения с подкреплением для достижения надёжных возможностей визуального восприятия.

Исследователи выявили слабое место современных мультимодальных моделей в решении научных и инженерных задач и предложили способ усилить их способность понимать визуальную информацию.

Квантовые эффекты и распад молекул: новый взгляд на термическое разрушение TATB

Исследование демонстрирует, что учет ядерных квантовых эффектов с помощью молекулярной динамики по интегралам траекторий (ПИМД) позволяет получить более точное описание термического разложения TATB, чем традиционные методы.

Искусственный интеллект как клиницист: обучение на опыте для точной диагностики

Система DxEvolve моделирует диагностический процесс как последовательное рассуждение, основанное на доказательствах, в отличие от статического анализа, применяемого при ретроспективной оценке, итеративно планируя дальнейшие шаги - от запроса обследований и лабораторных анализов до консультаций с внешними источниками - и формируя из каждой диагностической траектории компактные «примитивы диагностического мышления» (DCP), которые индексируются и используются повторно в последующих случаях, что позволяет системе непрерывно совершенствоваться на основе накопленного опыта, подтвержденного оценкой на данных MIMIC-CDM и в реальной клинической практике.

Новый подход к разработке систем поддержки принятия врачебных решений позволяет искусственному интеллекту эмулировать клиническое мышление и повышать точность диагностики за счет самообучения на реальных клинических данных.

Фокус на главное: ускорение генерации изображений без обучения

Исследование демонстрирует, что разработанный JiT-фреймворк обеспечивает устойчивую обобщающую способность в пространственно-временной области, сохраняя семантическую согласованность и временную когерентность при ускорении в [latex] \sim4\times [/latex] и [latex] \sim7\times [/latex] раз, используя в качестве базовой модели HunyuanVideo-1.5.

Новый подход позволяет значительно повысить скорость работы диффузионных моделей, динамически распределяя вычислительные ресурсы на наиболее важные участки изображения.