Голос языка: Почему лингвистам стоит обратить внимание на нейросети обработки речи

Новое исследование призывает лингвистов перенести фокус с текстовых моделей на системы, анализирующие непосредственно звуковую речь, чтобы глубже понять структуру человеческого языка.

Понимание мира вокруг: новый подход к обучению мобильных агентов

Разработанный комплекс MobileWorldBench, включающий в себя набор данных из 1,4 миллиона примеров MobileWorld, позволяет значительно улучшить способность языковых моделей зрения (VLM) выступать в роли моделей мира для мобильных агентов, демонстрируя существенный прирост производительности при задаче предсказания следующего состояния, особенно при использовании Qwen3-VL-8B-Instruct в качестве базовой модели и последующей тонкой настройке.

Исследователи предлагают перейти от предсказания отдельных пикселей к построению семантических моделей окружения, что открывает новые возможности для создания более умных и адаптивных мобильных агентов.

Искусственный интеллект под контролем: как соответствовать требованиям EU AI Act

Отображение между типом оценки и измеряемыми аспектами демонстрирует взаимосвязь, где каждый метод оценки направлен на конкретные грани оцениваемого объекта, формируя комплексную систему анализа.

Новая статья предлагает практическую структуру для оценки и проверки систем искусственного интеллекта высокого риска в соответствии с европейским законодательством.

Разреженность как ключ к скорости: Новая архитектура для мультимодальных моделей

Предлагается новый подход к моделированию - Sparse-LaViDa - для унифицированных мультимодальных маскированных дискретных диффузионных моделей, демонстрирующий значительное ускорение в задачах, таких как генерация изображений по тексту, редактирование изображений и визуальное математическое рассуждение, по сравнению с базовой моделью LaViDa-O.

Исследователи представили Sparse-LaViDa — инновационный подход к построению мультимодальных диффузионных моделей, позволяющий значительно ускорить процесс генерации контента.

Код под контролем: как опытные разработчики работают с ИИ-агентами

Новое исследование показывает, что профессиональные программисты не полагаются на интуитивное взаимодействие с ИИ, а предпочитают тщательно планировать и контролировать его работу для повышения эффективности и качества кода.

Самообучающиеся системы: новый подход к созданию многоагентных взаимодействий

В статье представлена методика автоматического поиска эффективных многоагентных систем, основанная на использовании грамматик и принципов модульного построения.

РеФьюжн: Новая архитектура для генерации текста

Система ReFusion использует итеративный цикл

Исследователи представили модель РеФьюжн, объединяющую сильные стороны диффузионных и авторегрессионных подходов для более быстрой и качественной генерации текста.

Базы данных под присмотром ИИ: Новая эра исследования данных

Система DAR демонстрирует сопоставимую с человеческим аналитиком производительность, что указывает на перспективность автоматизации задач, традиционно требующих экспертной оценки.

Исследователи представили систему DAR, способную автономно анализировать реляционные базы данных и находить ценные инсайты, значительно опережая возможности ручного анализа.