Искусственный интеллект — Страница 238

Видео будущего: новый подход к генерации длинных роликов

10.01.2026 от Денис Аветисян

Предложенная рекуррентная гибридная модель внимания демонстрирует снижение вычислительной сложности и задержки по сравнению с моделью Wan2.1 с полным softmax вниманием при увеличении длительности видео, что подтверждается качественным и количественным анализом на примере запроса «Кошка пьет воду» и достигается за счет использования 20 блоков ReHyAt.

Исследователи представили ReHyAt — механизм рекуррентного гибридного внимания, позволяющий создавать продолжительные видео с сохранением высокого качества и значительным снижением вычислительных затрат.

Наука по запросу: проверка искусственного интеллекта на прочность

10.01.2026 от Денис Аветисян

Новый бенчмарк SciIF позволяет оценить, насколько хорошо модели искусственного интеллекта способны не просто решать научные задачи, но и демонстрировать строгое следование научным принципам и ограничениям.

Видео в фокусе: ускорение генерации с помощью пирамидальной архитектуры

09.01.2026 от Денис Аветисян

Модель, использующая пирамидальную дистилляцию шагов, демонстрирует качество генерируемых видео, сопоставимое с результатами, полученными с помощью более ресурсоемких базовых моделей, что указывает на эффективность предложенного подхода к оптимизации вычислительных затрат без существенной потери качества.

Новый подход к оптимизации видео-диффузионных моделей позволяет значительно сократить время генерации, не жертвуя качеством изображения.

Воспроизводимость исследований ИИ: где кроется главная проблема?

09.01.2026 от Денис Аветисян

Новая работа предлагает формализовать понятие воспроизводимости в исследованиях искусственного интеллекта, чтобы сделать оценки систем автоматизации более надежными и сопоставимыми.

ИИ-художник: Как научить нейросети мыслить и создавать изображения

09.01.2026 от Денис Аветисян

В отличие от BAGEL, демонстрирующего компетентность в рассуждениях, но не отражающего этот процесс в итоговом изображении при сложных переплетённых запросах, Re-Align достигает сильной согласованности между рассуждением и генерацией благодаря структурированному IC-CoT, что позволяет более точно интерпретировать и визуализировать логику ответа.

Новый подход Re-Align позволяет значительно улучшить качество и согласованность изображений, генерируемых и редактируемых нейросетями, благодаря внедрению структурированного мышления.

Искусственный интеллект и экологический след: регуляторные лакуны

09.01.2026 от Денис Аветисян

Новый анализ показывает, что существующие нормативные рамки не способны эффективно контролировать растущее воздействие искусственного интеллекта на окружающую среду.

Искусственный интеллект осваивает игры: новый подход к обучению на больших данных

09.01.2026 от Денис Аветисян

Исследователи разработали масштабируемый метод обучения ИИ, позволяющий создавать универсальные игровые модели, способные эффективно играть в различные 3D-игры, используя только визуальные данные и действия игрока.

Найти данные в научном тексте: новый подход

09.01.2026 от Денис Аветисян

Исследование демонстрирует возможность установления связи между исследовательскими вопросами и наборами данных посредством анализа цитируемых контекстов, позволяя выявить неявные зависимости и закономерности в научной литературе.

Исследователи предлагают инновационный метод обнаружения научных наборов данных, основанный на анализе контекста цитирования в научных публикациях.

Искусственный судья: от языковой модели к интеллектуальному агенту

09.01.2026 от Денис Аветисян

Область применения подхода «Агент как судья» демонстрирует детализированную классификацию задач в различных областях, позволяя эффективно структурировать и анализировать широкий спектр проблем.

Обзор показывает, как оценка качества контента и решений переходит от простых языковых моделей к сложным системам, способным к планированию и взаимодействию.

Голос без границ: новый масштабный мультилингальный аудио-набор данных

09.01.2026 от Денис Аветисян

Набор данных LEMAS содержит более 150 тысяч часов многоязычной речи с принудительной выравниванием на уровне слов для десяти основных языков, что позволило разработать две модели: LEMAS-TTS, реализующую крупномасштабный, потоковый нейронный синтез речи из текста и короткого эталонного фрагмента, и LEMAS-Edit, предназначенную для редактирования речи на уровне слов с использованием кодека.

Представлен LEMAS — обширный ресурс для исследований в области генерации и редактирования речи, открывающий возможности для создания реалистичных голосов на разных языках.