Искусственный интеллект — Страница 27

Обучение с подкреплением: новый взгляд на опыт

19.03.2026 от Денис Аветисян

Дополнительное обучение с подкреплением позволяет агенту осваивать взаимодополняющие стратегии, расширяя возможности за счет совместного использования нескольких политик и, таким образом, преодолевая ограничения, присущие каждой отдельной стратегии, что позволяет достичь более устойчивых и адаптивных результатов.

В статье представлена методика, позволяющая значительно повысить эффективность обучения агентов на основе больших языковых моделей за счет интеллектуального управления и использования накопленного опыта.

Искусственный интеллект и искажение реальности: чьи выводы мы принимаем?

19.03.2026 от Денис Аветисян

Новое исследование показывает, как предвзятые алгоритмы могут незаметно влиять на человеческое восприятие и принятие решений в процессе анализа информации.

Видео в фокусе: Цена понимания движения для мультимодальных моделей

19.03.2026 от Денис Аветисян

После применения Video-SFT к моделям Qwen2.5-VL (7B, 32B, 72B) наблюдается дифференциация в механизмах внимания: в небольших моделях внимание становится более рассеянным при запросе вроде «Есть ли на изображении птица?», тогда как в крупных моделях сохраняется локализованная фокусировка на целевом объекте, что указывает на повышенную устойчивость к

Новое исследование показывает, как обучение моделей обработке видео может негативно сказаться на их способности понимать статические изображения.

Искусственный интеллект на страже справедливости: проверка на предвзятость в ранней диагностике рака толстой кишки

19.03.2026 от Денис Аветисян

Новое исследование демонстрирует, как системы искусственного интеллекта, использующие передовые методы обработки языка, могут помочь выявить и смягчить предвзятость в алгоритмах, предназначенных для ранней диагностики рака толстой кишки.

Обучение с подкреплением: как ускорить прогресс

19.03.2026 от Денис Аветисян

Эффективное исследование пространства состояний изменяет закон масштабирования, влияя на долю побед стратегии по сравнению с базовой, при увеличении объема обратной связи от человека, выраженного в количестве рассмотренных вариантов.

Новый подход к обучению с подкреплением на основе обратной связи от человека позволяет значительно повысить эффективность использования данных.

Земля говорит: Машинное обучение на службе у сейсмологов

19.03.2026 от Денис Аветисян

Обзор посвящен применению алгоритмов машинного обучения для анализа сейсмических и вулканических сигналов, позволяющих лучше понимать процессы, происходящие в недрах Земли.

Стереомир: Создание реалистичного 3D-видео с помощью искусственного интеллекта

19.03.2026 от Денис Аветисян

Мировая модель StereoWorld, в отличие от существующих, использует метрическую геометрию, что обеспечивает совместимость выходных данных с предварительно обученными моделями и позволяет достичь большей согласованности мелких деталей в стереоскопической визуализации для виртуальной реальности.

Новая модель StereoWorld позволяет генерировать стереоскопические видеоролики, точно воспроизводящие геометрию и внешний вид объектов, открывая новые возможности для виртуальной и дополненной реальности.

Экономика, управляемая ИИ: Прозрачный поиск оптимальных моделей

19.03.2026 от Денис Аветисян

В статье предлагается новый подход к использованию ИИ для автоматического поиска наилучших экономических моделей с обеспечением полной прозрачности и воспроизводимости результатов.

Виртуальный мир для роботов: новый подход к обучению

19.03.2026 от Денис Аветисян

Исследователи разработали модель, позволяющую роботам учиться действовать в смоделированной среде, предсказывая последствия своих действий.

Игры разума: Как нерациональность меняет взаимодействие человека и искусственного интеллекта

19.03.2026 от Денис Аветисян

В соревновании между стратегиями, основанными на обучении с подкреплением и искусственным интеллектом, наблюдается явное превосходство последней в оценке Q-функции для задач, связанных с конкуренцией между

Новое исследование показывает, как принципы поведенческой экономики влияют на стратегии и равновесные исходы в играх, где участвуют люди и интеллектуальные агенты.