Искусственный интеллект — Страница 168

Аудио размышляет: новый подход к пониманию звука

21.11.2025 от Денис Аветисян

Система Step-Audio-R1 представляет собой комплексный подход к обработке звука, позволяющий добиться значительного прогресса в задачах, связанных с анализом и синтезом аудиосигналов.

Исследователи представили модель Step-Audio-R1, способную к последовательному анализу звука и логическим выводам, что открывает новые возможности для обработки аудиоинформации.

Искусственный интеллект на службе науки: первые опыты с GPT-5

21.11.2025 от Денис Аветисян

Результат, тесно связанный с теоремой II.1.1 и представленный в работе [papadimitriou2000approximability], демонстрирует важную взаимосвязь в области приближаемых вычислений.

Новое исследование демонстрирует, как передовая языковая модель GPT-5 может значительно ускорить научные открытия в различных областях знаний.

RoMa v2: Сопоставление признаков нового поколения

21.11.2025 от Денис Аветисян

RoMa v2 демонстрирует превосходство над предыдущими алгоритмами плотного сопоставления в широком спектре задач оценки позы и плотного сопоставления, что подтверждается результатами экспериментов, детали которых представлены в разделе 4.

Новая версия алгоритма RoMa значительно улучшает точность и скорость сопоставления плотных признаков в задачах компьютерного зрения.

Врачебные диагнозы и искусственный интеллект: как формируются убеждения?

21.11.2025 от Денис Аветисян

Управляемые убеждения формируются посредством запросов, структурированных таким образом, чтобы задать желаемый уровень уверенности в утверждении, выраженном в виде $P(A|B)$, где $A$ представляет собой убеждение, а $B$ - контекст.

Новое исследование показывает, как предварительные убеждения влияют на диагностические способности больших языковых моделей, работающих в роли врачей.

Мультимодальный синтез: динамическая маршрутизация для новых возможностей

21.11.2025 от Денис Аветисян

Маршрутизатор демонстрирует динамическую адаптацию межслоевой маршрутизации, формируя различные паттерны связей в зависимости от семантики конкретных токенов, что указывает на его способность к тонкой настройке обработки информации.

Исследователи предлагают инновационный подход к генерации изображений и редактированию, основанный на адаптивной интеграции текстовой и визуальной информации.

Разумные машины: цена прогресса

21.11.2025 от Денис Аветисян

Статья показывает, что стремление к повышению эффективности ИИ для рассуждений может быть сведено на нет растущими вычислительными потребностями, требуя новых подходов к учету и регулированию.

Видеохроника: Автоматическое разделение длинных видео на логичные главы

20.11.2025 от Денис Аветисян

Модель автоматического сегментирования видео формирует структурированное представление контента, генерируя многоуровневые главы, включающие краткие заголовки, подробные аннотации с переработанными названиями, содержательными резюме и вводными описаниями ключевых моментов, а также точные по времени описания видеофрагментов, что обеспечивает эффективное и точное понимание видеоматериала.

Новая система использует возможности больших языковых моделей для структурирования часовых видеороликов, создавая удобную навигацию и иерархические дайджесты.

Аудио размышляет: новый подход к пониманию звука

Искусственный интеллект на службе науки: первые опыты с GPT-5

RoMa v2: Сопоставление признаков нового поколения

Врачебные диагнозы и искусственный интеллект: как формируются убеждения?

Мультимодальный синтез: динамическая маршрутизация для новых возможностей

Разумные машины: цена прогресса

Видеохроника: Автоматическое разделение длинных видео на логичные главы

Искусственный интеллект: права и ответственность в будущем

Визуальный интеллект: Модели учатся видеть и рассуждать самостоятельно

Разумная машина: сможет ли ИИ стать автором научных статей?