Денис Аветисян — Страница 178

Глубокое обучение и решение уравнений: в чем секрет надежности?

09.02.2026 от Денис Аветисян

Поведение алгоритма HINTS, обученного с использованием моделей DeepONet в статической схеме обучения, демонстрирует сходимость, зависящую от выбора функции потерь.

Новое исследование показывает, что успех гибридных методов, использующих нейросети для решения дифференциальных уравнений, зависит не столько от архитектуры сети, сколько от стратегии обучения и выбора парадигмы.

Искусственный интеллект на службе физики высоких энергий

09.02.2026 от Денис Аветисян

Система CoLLM принимает пользовательские спецификации анализа и данные LHCO, автоматически генерируя код для отбора, проводя валидацию и корректировку ошибок, после чего подготавливает данные для моделей глубокого обучения, демонстрируя комплексный подход к автоматизации процесса анализа данных.

Новый фреймворк автоматизирует анализ данных экспериментов на коллайдерах, делая сложные вычисления доступнее для ученых.

Обучение языковых моделей: новый подход к многоходовым взаимодействиям

09.02.2026 от Денис Аветисян

Многооборотные интерактивные задачи преобразуются в последовательность однооборотных задач для нескольких агентов, а глобальная оптимальность достигается посредством обратного распространения, основанного на теории MARL, позволяя системе эффективно решать сложные задачи, рассматривая их как серию независимых, но взаимосвязанных решений.

Исследователи предлагают алгоритм SeeUPO, обеспечивающий сходимость обучения больших языковых моделей в сценариях с многократным обменом репликами.

Трансформеры: Новый взгляд на архитектуру нейронных сетей

09.02.2026 от Денис Аветисян

$Исследование архитектурных вариантов Transformer с использованием «песочных часов» (hourglass) FFN, состоящих из [latex]K[/latex] подблоков, демонстрирует возможность оптимизации количества слоев [latex]L[/latex] и параметров [latex]d_{\text{model}}[/latex], [latex]d_h[/latex] для достижения различных характеристик производительности, в отличие от традиционных Transformer-блоков с узко-широко-узким MLP и фиксированным количеством слоев [latex]L^{\prime}[/latex].$

Исследователи предлагают переосмыслить структуру feed-forward сетей в трансформерах, повышая эффективность и позволяя сосредоточиться на механизме внимания.

Квантовые эффекты под контролем: новый подход к моделированию атомов

09.02.2026 от Денис Аветисян

Исследователи разработали метод постобработки для молекулярной динамики, позволяющий точнее учитывать квантовые эффекты и повысить достоверность симуляций.

Искусственный интеллект как разработчик: новый взгляд на доверие

09.02.2026 от Денис Аветисян

В статье рассматриваются требования к системам искусственного интеллекта, способным выполнять роль разработчиков программного обеспечения, и выделяются ключевые аспекты доверия, выходящие за рамки простого генерирования кода.

Мир в Модели: Самообучающиеся Системы и Скрытые Действия

09.02.2026 от Денис Аветисян

$Система InSWIRL, основанная на итеративном обучении с подкреплением, расширяет возможности моделирования мира для базовых моделей, используя совместно оптимизируемые прямую ([latex]P\_{\theta}(y\mid x,z)[/latex]) и обратную ([latex]Q\_{\phi}(z\mid x,y)[/latex]) динамические модели, где первая определяет предсказание следующего состояния, а вторая - действия, необходимые для достижения этого состояния, при этом, в ходе двухфазного процесса обучения, прямая модель выступает в роли стратегии, а обратная - в роли награды для обеспечения идентифицируемости, и наоборот, что обеспечивает соответствие данных последовательностям состояний.$

Новый подход позволяет языковым и визуальным моделям глубже понимать окружающий мир, самостоятельно совершенствуя свои навыки предсказания и планирования.

Массив оптических резонаторов: новый масштаб для изучения света и материи

09.02.2026 от Денис Аветисян

Исследователи продемонстрировали масштабируемый микроскоп на основе массива из 600 оптических резонаторов, открывая возможности для углубленного изучения взаимодействий света и материи.

Искусственный интеллект и юридическая проверка фактов: новый взгляд на сотрудничество

09.02.2026 от Денис Аветисян

В статье исследуется, как генеративные модели искусственного интеллекта могут быть интегрированы в работу юристов для повышения эффективности и точности проверки фактов.

Судить по Следствиям: Новый Подход к Оценке Решений Математических Задач

09.02.2026 от Денис Аветисян

$Оценка кандидатов решений посредством [latex]U(C^{1})>U(C^{2})[/latex] позволяет выявить наиболее вероятный ответ, используя в качестве решателя модель GPT-OSS-120B и измеряя точность предложений на соседних вопросах [latex]Q^{\*}[/latex].$

Исследователи предлагают инновационный метод оценки ответов на сложные математические вопросы, фокусируясь на их влиянии на решение смежных задач.