Видео под контролем: Новый подход к редактированию роликов по текстовому описанию
Исследователи представили EasyV2V — фреймворк, позволяющий точно и качественно изменять видеоряд, следуя простым текстовым инструкциям.
Исследователи представили EasyV2V — фреймворк, позволяющий точно и качественно изменять видеоряд, следуя простым текстовым инструкциям.

Новый подход позволяет моделям самостоятельно использовать специализированные инструменты для анализа и обнаружения признаков фальсификации на цифровых фотографиях.

Новая модель AdaTooler-V демонстрирует способность разумно применять визуальные инструменты, повышая точность и эффективность анализа мультимодальных данных.

Исследователи представили AIE4ML — комплексную систему для эффективной компиляции и развертывания нейронных сетей на перспективных AI-ускорителях AMD.

Исследователи разработали модель StereoPilot, использующую генеративные сети, для эффективного преобразования обычного видео в стереоскопическое 3D.
Исследование предлагает принципиально новый взгляд на мотивацию агентов, включая человека, утверждая, что стремление к предсказанию и обработке ошибок лежит в основе разумного поведения.

Исследователи представили модель DAP, способную точно оценивать глубину в панорамных изображениях, открывая новые возможности для приложений виртуальной и дополненной реальности.

Исследователи предлагают использовать принципы теории Ли для улучшения работы сверточных нейронных сетей при анализе текстовых данных.

В статье рассматриваются способы оптимизации процесса обучения с подкреплением за счет регулирования стратегий исследования и использования, с акцентом на методы обрезки, энтропии и устранения ложных сигналов.

Новая система AdaSearch позволяет языковым моделям самостоятельно определять, когда следует обращаться к внешним источникам знаний для решения задач.