Обучение с подкреплением: как приручить реальный мир

Обучение с подкреплением рассматривается как трёхкомпонентный процесс, включающий онлайн-оптимизацию в ходе каждой итерации, оффлайн-обучение и вывод между итерациями, а также непрерывный цикл развертывания и повторного развертывания для постоянного улучшения результатов.

Обзор посвящен статистическим методам обучения с подкреплением, позволяющим эффективно применять алгоритмы в условиях постоянно меняющейся среды и ограниченных данных.

Квантовая Диагонализация: Ускорение Вычислений на GPU и Многопоточных Процессорах

На вычислительной платформе Frontier наблюдается устойчивое масштабирование производительности GPU-ускоренного кода при увеличении числа узлов от одного до 128 и графических процессоров от 8 до 1024, что демонстрирует эффективность параллельных вычислений в задачах, требующих высокой производительности.

Новая реализация метода Sample-based Quantum Diagonalization позволяет значительно ускорить расчеты электронного строения молекул, открывая возможности для моделирования более сложных систем.

Муравьиный алгоритм под микроскопом: Формальное описание

В статье представлена строгая математическая модель алгоритмов оптимизации на основе колоний муравьев, позволяющая глубоко анализировать их поведение и возможности распараллеливания.

Сжатие изображений и текста: как эффективно уменьшить размер больших моделей

В данной работе исследовалось влияние квантизации на мультимодальные модели, такие как BLIP-2 и LLaVA, с целью выявления оптимальных стратегий и определения наиболее подходящих этапов конвейера для снижения вычислительной сложности без существенной потери производительности.

Новое исследование посвящено методам квантования, позволяющим значительно сократить размер многомодальных моделей, без существенной потери качества.

Вероятностные вычисления: как бороться с несовершенством чипов

Основанный на вероятностной природе p-битов, алгоритм имитации отжига [latex]\tilde{1}[/latex] отображает комбинационную задачу оптимизации на модель Изинга, в которой каждый p-бит подвержен смещению <i>h</i> и взаимодействует с другими битами посредством весов <i>J</i>, стремясь к минимизации энергии [latex]H_{min}[/latex] и, следовательно, к нахождению решения исходной задачи.

Новое исследование демонстрирует, как ускорить алгоритмы имитации отжига, используя вероятностные биты и графические процессоры, и как компенсировать влияние вариативности в современных микросхемах.

Искусственный интеллект на службе поиска: Новая платформа для обучения умных агентов

Исследователи представили SearchGym — симуляционную среду, позволяющую создавать и обучать поисковых агентов с высокой эффективностью и точностью.

Искусственный интеллект, исследующий сам себя: новый подход к автоматизации научных открытий

В разработанной автоматизированной системе, состоящей из исполнителя, планировщика и рабочего, процесс генерации идей управляется посредством эволюционного поиска и обучения с подкреплением, при котором оптимизируется только компонент, ответственный за выдвижение идей, а сам механизм их реализации остаётся неизменным.

В статье рассматривается возможность автоматизации процесса исследований в области искусственного интеллекта путем создания системы, способной самостоятельно генерировать и проверять новые идеи.

Квантовые траектории для изучения кварк-глюонной плазмы

Алгоритм кванмеханической траектории использует вычислительный граф, в котором детерминированные узлы вычисляют функции [latex]f[/latex] на основе входных данных, а стохастические узлы осуществляют выборку случайных переменных из распределения [latex]p[/latex], зависящего от параметров Θ, при этом как гамильтониан [latex]H[/latex], так и оператор скачка [latex]C[/latex] зависят от этих параметров.

Новый метод дифференцируемого моделирования позволяет эффективно оценивать транспортные свойства кварк-глюонной плазмы, возникающей в столкновениях тяжелых ионов.