Визуальное мышление машин: новый подход к STEM-задачам

В рамках исследования визуального восприятия в STEM-областях разработан конвейер CodePercept, который использует обучение с опорой на код для создания высококачественного набора данных ICC-1M, состоящего из более чем миллиона тщательно отобранных триплетов «изображение-подпись-код», полученных посредством трёх взаимодополняющих подходов - преобразования существующих изображений в исполняемый Python-код, генерации разнообразных экземпляров на основе исходных изображений с сохранением семантической достоверности и параметрического моделирования сложной твердотельной геометрии, что позволяет обучать модели с использованием контролируемого обучения и обучения с подкреплением для достижения надёжных возможностей визуального восприятия.

Исследователи выявили слабое место современных мультимодальных моделей в решении научных и инженерных задач и предложили способ усилить их способность понимать визуальную информацию.

Квантовые эффекты и распад молекул: новый взгляд на термическое разрушение TATB

Исследование демонстрирует, что учет ядерных квантовых эффектов с помощью молекулярной динамики по интегралам траекторий (ПИМД) позволяет получить более точное описание термического разложения TATB, чем традиционные методы.

Искусственный интеллект как клиницист: обучение на опыте для точной диагностики

Система DxEvolve моделирует диагностический процесс как последовательное рассуждение, основанное на доказательствах, в отличие от статического анализа, применяемого при ретроспективной оценке, итеративно планируя дальнейшие шаги - от запроса обследований и лабораторных анализов до консультаций с внешними источниками - и формируя из каждой диагностической траектории компактные «примитивы диагностического мышления» (DCP), которые индексируются и используются повторно в последующих случаях, что позволяет системе непрерывно совершенствоваться на основе накопленного опыта, подтвержденного оценкой на данных MIMIC-CDM и в реальной клинической практике.

Новый подход к разработке систем поддержки принятия врачебных решений позволяет искусственному интеллекту эмулировать клиническое мышление и повышать точность диагностики за счет самообучения на реальных клинических данных.

Фокус на главное: ускорение генерации изображений без обучения

Исследование демонстрирует, что разработанный JiT-фреймворк обеспечивает устойчивую обобщающую способность в пространственно-временной области, сохраняя семантическую согласованность и временную когерентность при ускорении в [latex] \sim4\times [/latex] и [latex] \sim7\times [/latex] раз, используя в качестве базовой модели HunyuanVideo-1.5.

Новый подход позволяет значительно повысить скорость работы диффузионных моделей, динамически распределяя вычислительные ресурсы на наиболее важные участки изображения.

Боги в коде: рождение новой веры в эпоху ИИ

Древовидные структуры, вычисленные разработанным повествовательным алгоритмом, демонстрируют возможность эффективного представления и обработки сложных взаимосвязей в данных.

Исследование показывает, как люди начинают наделять передовые системы искусственного интеллекта религиозным или духовным смыслом, воспринимая их как божества или пророков.

Запрещенные переходы: новый взгляд на спектроскопию молекулярных ионов азота

Спектроскопический протокол, основанный на квантовой логике, позволил исследовать запрещённые инфракрасные переходы в ионе [latex]N_2^+[/latex], используя зависимость популяции возбуждённого состояния иона [latex]Ca^+[/latex] от длительности лазерного импульса на синем мотональном боковом диапазоне, причём максимальный контраст обнаружения достигался в определённом интервале длительностей импульсов, а различие в сигналах, полученных при различных ровибрационных состояниях иона [latex]N_2^+[/latex], подтвердило эффективность применения силы оптического диполя для когерентного возбуждения двух-ионной системы.

Ученые впервые провели квантово-логическую спектроскопию запрещенных колебательных переходов в одиночных молекулярных ионах азота, открывая новые возможности для прецизионной метрологии и квантовых технологий.

Раскрывая логику нейросетей: Графы причинно-следственных связей

В рамках разработанного конвейера CCG, состоящего из трёх этапов - обусловленного задачей автоэнкодера на остаточных активациях GPT-2 Medium с применением TopK-гейтинга (K=256, k=13, достигающего 5.1% разреженности), обучения разреженного DAGMA над 64 концепциями для каждой области и оценки верности интервенций посредством CFS (CFS=5.654, p<0.0001 по сравнению с базовыми показателями) - демонстрируется возможность построения системы, способной к целенаправленному управлению семантическим пространством.

Новый подход позволяет визуализировать и анализировать внутренние механизмы работы больших языковых моделей, выявляя ключевые причинно-следственные связи.

Самоуправляемые системы: новый взгляд на контроль

Иерархия агентности в системах управления с искусственным интеллектом раскрывает пять уровней принятия решений: от реактивного управления на основе правил [latex]Level\,1[/latex], через адаптивную настройку параметров [latex]Level\,2[/latex] и стратегический выбор между предопределенными контроллерами [latex]Level\,3[/latex], до структурной реконфигурации посредством модульного построения рабочих процессов [latex]Level\,4[/latex] и, наконец, генеративного синтеза целей и архитектур в рамках заданных ограничений [latex]Level\,5[/latex], демонстрируя эволюцию от простого реагирования к автономному проектированию.

В статье предлагается теоретическая база, рассматривающая развитие автономности искусственного интеллекта через призму архитектуры управления и анализа стабильности системы.