Обучение с подкреплением: новый взгляд на опыт

Дополнительное обучение с подкреплением позволяет агенту осваивать взаимодополняющие стратегии, расширяя возможности за счет совместного использования нескольких политик и, таким образом, преодолевая ограничения, присущие каждой отдельной стратегии, что позволяет достичь более устойчивых и адаптивных результатов.

В статье представлена методика, позволяющая значительно повысить эффективность обучения агентов на основе больших языковых моделей за счет интеллектуального управления и использования накопленного опыта.

Ускорение расчетов электронной структуры: новый подход к потенциалам наложения атомов

В статье представлен эффективный метод вычисления матрицы потенциалов наложения атомов, позволяющий существенно сократить время расчетов электронной структуры молекул.

Видео в фокусе: Цена понимания движения для мультимодальных моделей

После применения Video-SFT к моделям Qwen2.5-VL (7B, 32B, 72B) наблюдается дифференциация в механизмах внимания: в небольших моделях внимание становится более рассеянным при запросе вроде «Есть ли на изображении птица?», тогда как в крупных моделях сохраняется локализованная фокусировка на целевом объекте, что указывает на повышенную устойчивость к

Новое исследование показывает, как обучение моделей обработке видео может негативно сказаться на их способности понимать статические изображения.

Искусственный интеллект на страже справедливости: проверка на предвзятость в ранней диагностике рака толстой кишки

Оценка семантического сходства между ответами двух агентов - эксперта в предметной области и консультанта по справедливости - продемонстрировала, что использование механизма RAG (Retrieval-Augmented Generation) в моделях различных размеров (Llama 3.1 8B, OSS 20B, OSS 120B) последовательно улучшает соответствие генерируемого текста эталонным утверждениям, что подтверждается статистически значимыми различиями в оценках сходства по сравнению с моделями, работающими без RAG или непосредственно на основе LLM.

Новое исследование демонстрирует, как системы искусственного интеллекта, использующие передовые методы обработки языка, могут помочь выявить и смягчить предвзятость в алгоритмах, предназначенных для ранней диагностики рака толстой кишки.

Квантовый пробой: Новый взгляд на диэлектрический разрушитель

В предложенной модели квантового распада, каждый узел содержит [latex]NN[/latex] фермионных мод, взаимодействующих друг с другом с единой силой [latex]J=1[/latex], что обеспечивает отсутствие беспорядка и унифицированное взаимодействие в системе.

Исследователи представили аналитически разрешимую модель квантового пробоя, раскрывающую уникальные спектральные и динамические свойства диэлектрических систем.

Земля говорит: Машинное обучение на службе у сейсмологов

Обзор посвящен применению алгоритмов машинного обучения для анализа сейсмических и вулканических сигналов, позволяющих лучше понимать процессы, происходящие в недрах Земли.

Квантовый бит на основе сверхпроводящих нанопроводов: новый подход к управлению кубитами

Квантовый бит, основанный на петле Dayem, состоит из двух сверхпроводящих электродов, соединенных параллельными нанопроводами, образующими плоский конденсатор, и функционирует под воздействием перпендикулярного магнитного поля, что позволяет управлять его квантовым состоянием.

В статье представлена новая конструкция кубита, использующая квантовую интерференцию в сверхпроводящих нанопроволоках для достижения и усиления нелинейности, необходимой для квантовых вычислений.

Экономика, управляемая ИИ: Прозрачный поиск оптимальных моделей

В статье предлагается новый подход к использованию ИИ для автоматического поиска наилучших экономических моделей с обеспечением полной прозрачности и воспроизводимости результатов.

Стереомир: Создание реалистичного 3D-видео с помощью искусственного интеллекта

Мировая модель StereoWorld, в отличие от существующих, использует метрическую геометрию, что обеспечивает совместимость выходных данных с предварительно обученными моделями и позволяет достичь большей согласованности мелких деталей в стереоскопической визуализации для виртуальной реальности.

Новая модель StereoWorld позволяет генерировать стереоскопические видеоролики, точно воспроизводящие геометрию и внешний вид объектов, открывая новые возможности для виртуальной и дополненной реальности.