Искусственный интеллект — Страница 164

Искусственный интеллект на службе физики высоких энергий

09.02.2026 от Денис Аветисян

Система CoLLM принимает пользовательские спецификации анализа и данные LHCO, автоматически генерируя код для отбора, проводя валидацию и корректировку ошибок, после чего подготавливает данные для моделей глубокого обучения, демонстрируя комплексный подход к автоматизации процесса анализа данных.

Новый фреймворк автоматизирует анализ данных экспериментов на коллайдерах, делая сложные вычисления доступнее для ученых.

Искусственный интеллект как разработчик: новый взгляд на доверие

09.02.2026 от Денис Аветисян

В статье рассматриваются требования к системам искусственного интеллекта, способным выполнять роль разработчиков программного обеспечения, и выделяются ключевые аспекты доверия, выходящие за рамки простого генерирования кода.

Трансформеры: Новый взгляд на архитектуру нейронных сетей

09.02.2026 от Денис Аветисян

$Исследование архитектурных вариантов Transformer с использованием «песочных часов» (hourglass) FFN, состоящих из [latex]K[/latex] подблоков, демонстрирует возможность оптимизации количества слоев [latex]L[/latex] и параметров [latex]d_{\text{model}}[/latex], [latex]d_h[/latex] для достижения различных характеристик производительности, в отличие от традиционных Transformer-блоков с узко-широко-узким MLP и фиксированным количеством слоев [latex]L^{\prime}[/latex].$

Исследователи предлагают переосмыслить структуру feed-forward сетей в трансформерах, повышая эффективность и позволяя сосредоточиться на механизме внимания.

Мир в Модели: Самообучающиеся Системы и Скрытые Действия

09.02.2026 от Денис Аветисян

$Система InSWIRL, основанная на итеративном обучении с подкреплением, расширяет возможности моделирования мира для базовых моделей, используя совместно оптимизируемые прямую ([latex]P\_{\theta}(y\mid x,z)[/latex]) и обратную ([latex]Q\_{\phi}(z\mid x,y)[/latex]) динамические модели, где первая определяет предсказание следующего состояния, а вторая - действия, необходимые для достижения этого состояния, при этом, в ходе двухфазного процесса обучения, прямая модель выступает в роли стратегии, а обратная - в роли награды для обеспечения идентифицируемости, и наоборот, что обеспечивает соответствие данных последовательностям состояний.$

Новый подход позволяет языковым и визуальным моделям глубже понимать окружающий мир, самостоятельно совершенствуя свои навыки предсказания и планирования.

Судить по Следствиям: Новый Подход к Оценке Решений Математических Задач

09.02.2026 от Денис Аветисян

$Оценка кандидатов решений посредством [latex]U(C^{1})>U(C^{2})[/latex] позволяет выявить наиболее вероятный ответ, используя в качестве решателя модель GPT-OSS-120B и измеряя точность предложений на соседних вопросах [latex]Q^{\*}[/latex].$

Исследователи предлагают инновационный метод оценки ответов на сложные математические вопросы, фокусируясь на их влиянии на решение смежных задач.

Искусственный интеллект и юридическая проверка фактов: новый взгляд на сотрудничество

09.02.2026 от Денис Аветисян

В статье исследуется, как генеративные модели искусственного интеллекта могут быть интегрированы в работу юристов для повышения эффективности и точности проверки фактов.

Канзона: Гармонизация распределенного обучения больших моделей

09.02.2026 от Денис Аветисян

В предложенной стратегии тензорного параллелизма (TP-ASC) микрогрупповое планирование градиентов позволяет насытить пропускную способность коммуникации типа

Новый фреймворк упрощает и ускоряет процесс обучения масштабных нейронных сетей, обеспечивая эффективное распределение нагрузки и высокую производительность.

От признаков к действиям: как понять поведение сложных ИИ

09.02.2026 от Денис Аветисян

Цикл исполнения агента, чётко разделяющий семантику состояния, действия и наблюдения, позволяет реконструировать траекторию и анализировать её для создания минимальных пакетов объяснений (MEP), необходимых для аудита и диагностики, тем самым отделив исполнение от интерпретируемости и верификации.

Новое исследование показывает, что традиционные методы объяснения работы искусственного интеллекта неэффективны при анализе многошаговых действий, требуя более глубокого подхода к пониманию логики агентов.

Город будущего: Прогнозирование климатических рисков с помощью ИИ

09.02.2026 от Денис Аветисян

Предлагаемая архитектура Skjold-DiT представляет собой комплексный подход к прогнозированию рисков, связанных с жилищным фондом, учитывающий как климатическую устойчивость, так и транспортную доступность, стремясь к созданию более надежной и адаптивной среды обитания.

Новая модель Skjold-DiT позволяет предсказывать влияние изменений климата на городскую инфраструктуру и оценивать эффективность различных стратегий адаптации.

Открытие научных закономерностей: новый подход

09.02.2026 от Денис Аветисян

Процесс PiEvo осуществляет эволюцию оптимизируемого пространства принципов посредством последовательного исследования гипотетических кандидатов, стремясь к выявлению принципа, способного объяснить или предсказать наблюдаемые явления, такие как эмпирические данные.

Исследователи предлагают инновационную систему, способную самостоятельно находить и уточнять научные принципы, используя методы байесовской оптимизации и обнаружения аномалий.