Визуальное мышление машин: новый подход к STEM-задачам

Исследователи выявили слабое место современных мультимодальных моделей в решении научных и инженерных задач и предложили способ усилить их способность понимать визуальную информацию.

Исследователи выявили слабое место современных мультимодальных моделей в решении научных и инженерных задач и предложили способ усилить их способность понимать визуальную информацию.
Разработана система искусственного интеллекта, способная не только ставить дифференциальный диагноз в кардиологии, но и объяснять ход своих рассуждений.
![Исследование демонстрирует, что разработанный JiT-фреймворк обеспечивает устойчивую обобщающую способность в пространственно-временной области, сохраняя семантическую согласованность и временную когерентность при ускорении в [latex] \sim4\times [/latex] и [latex] \sim7\times [/latex] раз, используя в качестве базовой модели HunyuanVideo-1.5.](https://arxiv.org/html/2603.10744v1/hunyuan.png)
Новый подход позволяет значительно повысить скорость работы диффузионных моделей, динамически распределяя вычислительные ресурсы на наиболее важные участки изображения.

Исследование показывает, как люди начинают наделять передовые системы искусственного интеллекта религиозным или духовным смыслом, воспринимая их как божества или пророков.

Новый подход позволяет создавать персонализированные видео и аудио, сохраняя уникальные черты человека и реагируя на текстовые запросы.
![Спектроскопический протокол, основанный на квантовой логике, позволил исследовать запрещённые инфракрасные переходы в ионе [latex]N_2^+[/latex], используя зависимость популяции возбуждённого состояния иона [latex]Ca^+[/latex] от длительности лазерного импульса на синем мотональном боковом диапазоне, причём максимальный контраст обнаружения достигался в определённом интервале длительностей импульсов, а различие в сигналах, полученных при различных ровибрационных состояниях иона [latex]N_2^+[/latex], подтвердило эффективность применения силы оптического диполя для когерентного возбуждения двух-ионной системы.](https://arxiv.org/html/2603.10553v1/x2.png)
Ученые впервые провели квантово-логическую спектроскопию запрещенных колебательных переходов в одиночных молекулярных ионах азота, открывая новые возможности для прецизионной метрологии и квантовых технологий.
![Иерархия агентности в системах управления с искусственным интеллектом раскрывает пять уровней принятия решений: от реактивного управления на основе правил [latex]Level\,1[/latex], через адаптивную настройку параметров [latex]Level\,2[/latex] и стратегический выбор между предопределенными контроллерами [latex]Level\,3[/latex], до структурной реконфигурации посредством модульного построения рабочих процессов [latex]Level\,4[/latex] и, наконец, генеративного синтеза целей и архитектур в рамках заданных ограничений [latex]Level\,5[/latex], демонстрируя эволюцию от простого реагирования к автономному проектированию.](https://arxiv.org/html/2603.10779v1/Figs/beautiful_agency_hierarchy.png)
В статье предлагается теоретическая база, рассматривающая развитие автономности искусственного интеллекта через призму архитектуры управления и анализа стабильности системы.

Новый подход позволяет визуализировать и анализировать внутренние механизмы работы больших языковых моделей, выявляя ключевые причинно-следственные связи.

В этой статье мы прослеживаем историю развития детекторов времени в физике высоких энергий, от специализированных систем до полностью интегрированных 4D-трековых систем.

Новое исследование показывает, что совместное написание текстов с искусственным интеллектом может перестраивать мыслительные процессы, заставляя авторов реагировать на предложения, а не генерировать собственные идеи.