Матричные вычисления: новый уровень оптимизации с помощью искусственного интеллекта

Оптимизация CUDA-ядер для матричного умножения выявляет закономерности в выборе гиперпараметров, определяющие эффективность и производительность вычислений.

Исследователи разработали систему, способную значительно ускорить вычисления матричных произведений на графических процессорах, используя возможности машинного обучения.

Музыка оживает в видео: новый подход к генерации роликов

На основе различных комбинаций движения камеры, система YingVideo-MV генерирует разнообразные видеоматериалы, демонстрируя гибкость и адаптивность подхода к созданию динамичного видеоконтента.

Исследователи представили систему, способную создавать длинные, синхронизированные с музыкой видеоролики с плавными переходами камеры и реалистичным визуальным рядом.

Языковые модели, которые учатся сами: новый подход к развитию интеллекта

Модель R-Fewdelays преодолевает плато производительности, характерное для R-Zero, демонстрируя более высокие результаты и стабильную самоэволюцию на различных эталонных задачах.

Исследователи представили систему, позволяющую большим языковым моделям самостоятельно совершенствоваться с минимальным участием человека, достигая впечатляющих результатов в рассуждениях.

Сознание машин: этика в эпоху неопределенности

Новая работа предлагает этическую основу для обсуждения вопросов, связанных с потенциальным сознанием искусственного интеллекта, ставя во главу угла благополучие человека.

Звук как помощник зрения: Новые горизонты генерации видео

Архитектура AVFullDiT и Audio-Video Full Attention демонстрирует совместное предсказание скоростей видео и аудио посредством унифицированной функции потерь flow-matching, при этом AVFullDiT использует предварительно обученные блоки T2V/T2A, а AVFull-Attention применяет симметричный механизм MHSA к объединенной последовательности аудио-видео токенов, расширяя аудио-проекции адаптерными матрицами для согласованной обработки модальностей.

Исследование показывает, что добавление аудиоинформации в процесс обучения моделей генерации видео значительно улучшает качество, реалистичность и физическую правдоподобность создаваемых роликов.

Видеопонимание нового уровня: Искусственный интеллект, запоминающий детали

В рамках исследования разработана система WorldMM, конструирующая три взаимодополняющие памяти - эпизодическую, семантическую и визуальную - для захвата временных событий, долгосрочных связей и визуальных деталей из видеопотоков, после чего адаптивный агент извлечения итеративно отбирает и интегрирует релевантную информацию из этих воспоминаний, используя её совместно с историей рассуждений для генерации обоснованного ответа.

Новая модель WorldMM демонстрирует впечатляющую способность к анализу и логическому мышлению на основе длинных видеороликов, используя динамическую мультимодальную память.

Искусственный интеллект на службе недр: новый подход к поиску полезных ископаемых

В статье рассматривается перспектива использования искусственного интеллекта для радикального повышения эффективности и устойчивости геологоразведочных работ.