Искусственный интеллект на службе физики высоких энергий

Новый фреймворк автоматизирует анализ данных экспериментов на коллайдерах, делая сложные вычисления доступнее для ученых.

Новый фреймворк автоматизирует анализ данных экспериментов на коллайдерах, делая сложные вычисления доступнее для ученых.
В статье рассматриваются требования к системам искусственного интеллекта, способным выполнять роль разработчиков программного обеспечения, и выделяются ключевые аспекты доверия, выходящие за рамки простого генерирования кода.
![Исследование архитектурных вариантов Transformer с использованием «песочных часов» (hourglass) FFN, состоящих из [latex]K[/latex] подблоков, демонстрирует возможность оптимизации количества слоев [latex]L[/latex] и параметров [latex]d_{\text{model}}[/latex], [latex]d_h[/latex] для достижения различных характеристик производительности, в отличие от традиционных Transformer-блоков с узко-широко-узким MLP и фиксированным количеством слоев [latex]L^{\prime}[/latex].](https://arxiv.org/html/2602.06471v1/figures/260113_hourglass_LLM.png)
Исследователи предлагают переосмыслить структуру feed-forward сетей в трансформерах, повышая эффективность и позволяя сосредоточиться на механизме внимания.
![Система InSWIRL, основанная на итеративном обучении с подкреплением, расширяет возможности моделирования мира для базовых моделей, используя совместно оптимизируемые прямую ([latex]P\_{\theta}(y\mid x,z)[/latex]) и обратную ([latex]Q\_{\phi}(z\mid x,y)[/latex]) динамические модели, где первая определяет предсказание следующего состояния, а вторая - действия, необходимые для достижения этого состояния, при этом, в ходе двухфазного процесса обучения, прямая модель выступает в роли стратегии, а обратная - в роли награды для обеспечения идентифицируемости, и наоборот, что обеспечивает соответствие данных последовательностям состояний.](https://arxiv.org/html/2602.06130v1/x1.png)
Новый подход позволяет языковым и визуальным моделям глубже понимать окружающий мир, самостоятельно совершенствуя свои навыки предсказания и планирования.
![Оценка кандидатов решений посредством [latex]U(C^{1})>U(C^{2})[/latex] позволяет выявить наиболее вероятный ответ, используя в качестве решателя модель GPT-OSS-120B и измеряя точность предложений на соседних вопросах [latex]Q^{\*}[/latex].](https://arxiv.org/html/2602.06291v1/x1.png)
Исследователи предлагают инновационный метод оценки ответов на сложные математические вопросы, фокусируясь на их влиянии на решение смежных задач.

В статье исследуется, как генеративные модели искусственного интеллекта могут быть интегрированы в работу юристов для повышения эффективности и точности проверки фактов.

Новый фреймворк упрощает и ускоряет процесс обучения масштабных нейронных сетей, обеспечивая эффективное распределение нагрузки и высокую производительность.

Новое исследование показывает, что традиционные методы объяснения работы искусственного интеллекта неэффективны при анализе многошаговых действий, требуя более глубокого подхода к пониманию логики агентов.

Новая модель Skjold-DiT позволяет предсказывать влияние изменений климата на городскую инфраструктуру и оценивать эффективность различных стратегий адаптации.

Исследователи предлагают инновационную систему, способную самостоятельно находить и уточнять научные принципы, используя методы байесовской оптимизации и обнаружения аномалий.