Память, которая адаптируется: новый подход к долгосрочному мышлению

MemFly представляет собой фреймворк, в котором поступающие наблюдения преобразуются в структурированную память посредством семантического усвоения и управляемого обновления, при этом оптимизатор на основе LLM выбирает операции слияния, связывания или добавления для минимизации целевой функции IB, а организованная иерархией «Заметка-Ключевое слово-Тема» память извлекается посредством трипутевого поиска и итеративной оценки доказательств для ответов на сложные запросы.

Исследователи представили MemFly — систему, оптимизирующую память языковых моделей для повышения качества рассуждений и сохранения важной информации.

Оживляем видео: точная вставка объектов с минимальными усилиями

Система PISCO позволяет точно вставлять произвольные объекты в видео, используя лишь несколько ключевых кадров, при этом обеспечивая когерентную временную динамику и реалистичные физические эффекты, сохраняя при этом естественное поведение фона.

Новая модель PISCO позволяет реалистично добавлять и перемещать объекты в видео, требуя лишь небольшое количество ключевых кадров для управления процессом.

Эволюция мозга: оптимизация моделей с учётом иерархии

Оптимизация, основанная на биологических принципах, выявляет устойчивые связи между параметрами мозга и поведенческими особенностями - когнитивными способностями и различными проявлениями внутренних и внешних поведенческих проблем - что подтверждается статистически значимыми результатами, превосходящими случайный уровень и оцениваемыми с помощью [latex]R^{2}[/latex] и соответствующих [latex]p[/latex]- и [latex]q[/latex]-значений, полученных посредством перестановки меток поведения.

Новое исследование показывает, как вдохновлённый биологией подход к оптимизации целых моделей мозга позволяет улучшить их обобщающую способность и точность предсказаний когнитивных и поведенческих особенностей.

Скрытая Симметрия в Обучении с Подкреплением: Почему Модели Застревают в Рутине

В архитектуре GRAE, применяемой в GRPO, наблюдается проблема симметрии преимуществ, проявляющаяся как на групповом, так и на уровне отдельных выборок: на групповом уровне веса преимуществ для корректных и некорректных траекторий оказываются равными, что приводит к отсутствию изменений в логитах маловероятных, но верных путей и препятствует исследованию, а на уровне выборок наибольшая сумма абсолютных значений преимуществ наблюдается у выборок средней сложности, что снижает эффективность обучения на более сложных данных.

Новое исследование выявляет фундаментальную проблему в современных алгоритмах обучения с подкреплением на основе обратной связи от человека, ограничивающую их способность к исследованию и адаптации к новым задачам.

Автоматизация CFD: Искусственный интеллект берет управление на себя

Автоматизированный агент, использующий инструменты, выполняет вычислительные задачи гидродинамики с помощью OpenFOAM, Gmsh и Python, при этом специализированный запрос, ориентированный на обучение и повторное использование существующих решений, итеративно корректирует процесс вычислений, начиная с подходящего этапа до достижения заданного времени завершения, обеспечивая самоконтроль и надежность выполнения.

Новое исследование показывает, как системы искусственного интеллекта могут упростить и повысить надежность сложных расчетов в области гидрогазодинамики.

Раскрывая секреты белковых сетей: новый взгляд на машинное обучение

Модель ProtoMech, основанная на межслоевых транскодерах, предсказывает выходные данные каждого слоя на основе разреженных скрытых признаков предшествующих слоёв, позволяя проектировать белковые варианты с улучшенными функциональными свойствами и выявлять ранее скрытые биологические мотивы посредством визуализации.

Исследователи разработали инновационный метод для анализа внутренних механизмов моделей машинного обучения, предназначенных для изучения белков, позволяющий понять, как эти модели принимают решения.

Коллективный разум нейросети: новый подход к решению сложных задач

Архитектура PRIME включает в себя исполнитель, генерирующий шаги рассуждений, которые немедленно проверяются верификатором, а при нарушении ограничений координатор управляет возвратом посредством стека состояний, при этом вся политика итеративно совершенствуется с использованием групповой относительной оптимизации политики (GRPO).

Исследователи предлагают систему, в которой несколько виртуальных агентов, управляемых большой языковой моделью, совместно решают алгоритмические задачи, значительно превосходя существующие методы.