Изучение поведения: как квантование действий повышает стабильность

В новой работе исследователи предлагают эффективный подход к обучению с подражанием, позволяющий добиться стабильности при использовании квантованных действий без полного исследования всех возможных последствий.

Искусственный разум как научное сообщество: рой для открытий

Сообщество искусственного интеллекта визуализировано посредством генеративной модели Nano Banana 2, доступной на платформе Openart, демонстрируя возможности создания сложных визуальных представлений с помощью передовых алгоритмов.

Новый подход объединяет возможности больших языковых моделей и принципы роевого интеллекта для создания виртуальных лабораторий, способных к децентрализованному научному поиску.

Разум и Формулы: Новый Подход к Автоматическому Доказательству Теорем

Обучение модели LongCat-Flash-Prover осуществляется посредством итеративного процесса, начинающегося с предварительно обученной модели LongCat Mid-train, после чего применяется смешанное обучение с подкреплением для получения базовой модели, которая затем последовательно улучшается за счёт самодистилляции и агентного обучения с подкреплением, что позволяет достичь значительного повышения производительности на каждой итерации.

Исследователи представили модель LongCat-Flash-Prover, сочетающую в себе возможности больших языковых моделей и формальной логики для решения сложных задач автоматического доказательства и формализации.

Искусственный интеллект и оценка развернутых ответов: новый взгляд на валидность

В статье рассматриваются уникальные вызовы и требования к подтверждению надежности использования генеративных моделей ИИ для автоматической оценки письменных работ.

Раскрытие потенциала языковых моделей: новый взгляд на обучение с подкреплением

Успешность обучения с подкреплением после предварительного обучения демонстрирует зависимость от времени, отражая динамику освоения стратегии в процессе оптимизации.

Исследование показывает, что возвращение к принципам марковских состояний в процессе постобработки значительно улучшает производительность и обобщающую способность больших языковых моделей.

Зачем школьникам нейросети: мотивация и использование ИИ в учебе

Новое исследование показывает, как внутренние установки мексиканских старшеклассников влияют на то, как они применяют генеративные модели искусственного интеллекта в математике и письме.

Рекомендации, которые учатся: как генеративные модели справляются с новым контентом

Для GR-моделей обобщение на уровне элементов может сводиться к запоминанию на уровне токенов, что демонстрирует потенциальную ограниченность способности модели к истинному обобщению.

Новое исследование показывает, что генеративные рекомендательные системы превосходят традиционные в предсказании поведения пользователей при столкновении с ранее не встречавшимися последовательностями, но уступают в запоминании популярных паттернов.

Интеллектуальное управление ускорительным комплексом Fermilab

В статье описывается создание инфраструктуры для интеграции искусственного интеллекта и машинного обучения в системы управления ускорителями Fermilab, направленной на повышение эффективности и надежности работы оборудования.

Иллюзии понимания: Как правильно оценивать объяснимые модели

Исследование производительности алгоритмов анализа схем по шести задачам демонстрирует, что, несмотря на высокую точность определения функциональности компонентов и кластеров, соответствие экспертным оценкам остаётся неполным, указывая на существующие расхождения между автоматическим анализом и человеческим пониманием принципов работы схем.

Новое исследование выявляет скрытые недостатки существующих методов оценки систем интерпретации машинного обучения и предлагает альтернативный подход.