Искусственный интеллект — Страница 117

Видео под контролем: Новый подход к редактированию роликов по текстовому описанию

21.12.2025 от Денис Аветисян

Исследователи представили EasyV2V — фреймворк, позволяющий точно и качественно изменять видеоряд, следуя простым текстовым инструкциям.

Искусственный интеллект на страже правды: как нейросети учатся выявлять подделки изображений

21.12.2025 от Денис Аветисян

Система ForenAgent автономно формирует Python-инструментарий, адаптированный к конкретной задаче, точно выявляет подделку с указанием области манипуляций и демонстрирует способность к самокоррекции, уточняя первоначально неверно локализованный фрагмент до корректной области интереса.

Новый подход позволяет моделям самостоятельно использовать специализированные инструменты для анализа и обнаружения признаков фальсификации на цифровых фотографиях.

Зрячий разум: адаптивное использование инструментов для обработки изображений и видео

21.12.2025 от Денис Аветисян

$В отличие от существующих моделей, слепо призывающих инструменты, AdaTooler-V адаптированно использует их, определяя необходимость в помощи инструментов для решения конкретной задачи, что подтверждается распределением $ \Delta S $ в наборе данных AdaTooler-V-300k, где положительные и отрицательные значения указывают на пользу или бесполезность инструментов, вычисляемых как разница в средней точности модели Qwen2.5-VL-72B-Instruct при решении задачи с использованием и без использования инструментов.$

Новая модель AdaTooler-V демонстрирует способность разумно применять визуальные инструменты, повышая точность и эффективность анализа мультимодальных данных.

Ускорение нейросетей: новый подход для процессоров AMD

21.12.2025 от Денис Аветисян

Конвейер компиляции AIE4ML преобразует высокоуровневые сетевые модели посредством последовательности оптимизаций, включающих квантование, разбиение на блоки, упаковку и связность графа, в оптимизированный проект для AIE, готовый к сборке или моделированию.

Исследователи представили AIE4ML — комплексную систему для эффективной компиляции и развертывания нейронных сетей на перспективных AI-ускорителях AMD.

Превращая плоское в объемное: новый подход к стереоконверсии видео

20.12.2025 от Денис Аветисян

$Система StereoPilot использует одношаговую прямую архитектуру, включающую обучаемые переключатели доменов для унификации преобразования как для параллельных, так и для сходящихся стереоформатов, при этом полная модель оптимизируется посредством циклического обучения, сочетающего потери реконструкции и циклической согласованности, что обеспечивает высокую точность и геометрическую выровненность, где синие и оранжевые линии обозначают процессы реконструкции слева направо и справа налево, а оранжевая пунктирная линия - путь циклической согласованности $L\rightarrow R\rightarrow L$.$

Исследователи разработали модель StereoPilot, использующую генеративные сети, для эффективного преобразования обычного видео в стереоскопическое 3D.

Зачем нам ошибаться: новая теория интеллекта

20.12.2025 от Денис Аветисян

Исследование предлагает принципиально новый взгляд на мотивацию агентов, включая человека, утверждая, что стремление к предсказанию и обработке ошибок лежит в основе разумного поведения.

Панорамная глубина: новая основа для компьютерного зрения

20.12.2025 от Денис Аветисян

$Основываясь на архитектуре сети DAP, разработанной с использованием DINOv3-Large, модель обеспечивает адаптивный контроль над расстоянием в разнообразных сценах посредством декодера глубины, учитывающего искажения, и подключаемой маски диапазона, а обучение оптимизируется за счёт многоуровневых геометрических и чёткостных потерь, включающих $ \mathcal{L}\_{SILog}$, $ \mathcal{L}\_{DF}$, $ \mathcal{L}\_{grad}$, $ \mathcal{L}\_{normal}$ и $ \mathcal{L}\_{pts}$, что гарантирует метрическую точность, чёткость границ и геометрическую согласованность при оценке глубины панорамных изображений.$

Исследователи представили модель DAP, способную точно оценивать глубину в панорамных изображениях, открывая новые возможности для приложений виртуальной и дополненной реальности.

Симметрия в языке: новый подход к классификации предложений

20.12.2025 от Денис Аветисян

Предложены модели классификации предложений, использующие сверточный слой Ли для получения векторных представлений, где SCLie - однослойная архитектура, применяющая фильтры различной ширины, а DPCLie - ее углубленная версия, включающая блок сверточных слоев для понижения размерности, что позволяет увеличить глубину сети без значительного увеличения вычислительной нагрузки.

Исследователи предлагают использовать принципы теории Ли для улучшения работы сверточных нейронных сетей при анализе текстовых данных.

Баланс между исследованием и использованием: Новый взгляд на обучение с подкреплением

20.12.2025 от Денис Аветисян

В процессе обучения с случайным вознаграждением, энтропия стратегии модели Qwen2.5-Math-7B демонстрирует различную динамику в зависимости от применения обрезки градиентов: необрезанное обучение может приводить к взрыву градиентов, как показано на примере R1-Distill-Llama-8B, в то время как обрезка позволяет стабилизировать процесс обучения и контролировать энтропию стратегии.

В статье рассматриваются способы оптимизации процесса обучения с подкреплением за счет регулирования стратегий исследования и использования, с акцентом на методы обрезки, энтропии и устранения ложных сигналов.

Искусственный интеллект, который знает, когда ему нужна подсказка

20.12.2025 от Денис Аветисян

В предложенной системе AdaSearch агент сначала оценивает возможность решения запроса, опираясь на имеющиеся параметрические знания, а затем, в зависимости от достаточности этих знаний, либо следует соответствующему запросу, либо переключается на поиск и рассуждения для получения окончательного ответа.

Новая система AdaSearch позволяет языковым моделям самостоятельно определять, когда следует обращаться к внешним источникам знаний для решения задач.