Восстановление 3D-модели человека по видео: новый подход без обучения

Предлагаемый фреймворк SAM-Body4D, работающий без обучения, извлекает согласованные во времени маски из видео, используя модуль Masklet Generator, затем обогащает их, восстанавливая скрытые части тела и стабилизируя временную последовательность при помощи Occlusion-Aware Masklet Refiner, и, наконец, применяет уточненные маски в качестве пространственных подсказок для модуля Mask-Guided HMR, обеспечивая точное и согласованное во времени предсказание 3D-моделей человеческого тела на протяжении всей последовательности.

Ученые разработали метод, позволяющий создавать реалистичные 3D-модели тела человека на основе видеозаписи, без необходимости предварительного обучения нейронной сети.

Искусственный интеллект оценивает интеллект: новый подход к проверке текстов

В рамках разработанной системы AgentEval оценивается качество сгенерированных текстов посредством анализа по пяти ключевым параметрам - связности, релевантности, интересности, справедливости и ясности - с использованием двух основных компонентов: логической цепочки рассуждений и генеративного агента, что позволяет выявить сильные и слабые стороны созданного контента.

Исследователи предлагают использовать продвинутые языковые модели в роли «экспертов», способных оценивать качество генерируемых ИИ текстов, приближаясь к человеческому восприятию.

Искусственный интеллект под защитой: Новая эра приватности в коллаборации агентов

В рамках разработанной системы $𝖠𝗀𝖾𝗇𝗍𝖢𝗋𝗒𝗉𝗍\mathsf{AgentCrypt}$ агенты взаимодействуют с обеспечением конфиденциальности, при котором даже агент, обладающий доступом к данным в состоянии покоя, не может получить доступ к зашифрованной информации, что демонстрирует многоуровневый подход к защите данных.

Исследователи представили 𝖠𝗀𝖾𝗇𝗍𝖢𝗋𝗒𝗉𝗍 — инновационную систему, обеспечивающую безопасное взаимодействие между ИИ-агентами и защиту конфиденциальных данных.

Искусственный интеллект на службе пациентам: новый подход к подбору клинических испытаний

Разработана система, использующая возможности современных нейросетей для автоматизации и повышения эффективности процесса сопоставления пациентов с подходящими клиническими исследованиями.

Зрение, Язык и Движение: Новая Архитектура для Навигации

Предложенная двухсистемная архитектура разделяет высокоуровневое рассуждение и низкоуровневое управление: система 2 (медленная, 2 Гц) использует предварительно обученную VLM с 7B параметрами для генерации пиксельных и латентных целей, в то время как система 1 (быстрая, 30 Гц) представляет собой легковесную политику на основе диффузии, преобразующую эти цели в плавные траектории с использованием высокочастотных RGB-входов, что обеспечивает непрерывную и плавную навигацию и позволяет достичь передовых результатов на VLN-CE и VLN-PE, демонстрируя при этом высокую обобщающую способность в реальных условиях.

Исследователи представили инновационную систему, объединяющую возможности обработки языка и зрения для создания более эффективных и адаптивных роботов-навигаторов.

Искусственный интеллект: путь к надежности и соответствию нормам

В статье представлена комплексная структура SMART+, обеспечивающая разработку и внедрение ИИ-систем, соответствующих этическим и регуляторным требованиям.

Искусство генерации: как обучить нейросети видеть мир нашими глазами

Рамка TreeGRPO оптимизирует процесс шумоподавления диффузионных/потоковых моделей посредством построения деревьев поиска, начиная с общего начального шума и исследуя множественные траектории с ветвлением на промежуточных этапах, используя повторное использование префиксов для поэтапных преимуществ.

Новый алгоритм TreeGRPO позволяет значительно улучшить процесс обучения генеративных моделей, приближая их к человеческому восприятию и предпочтениям.

Коллективный разум машин: к созданию многоагентного ИИ

Новое исследование показывает, что для достижения подлинного многоагентного интеллекта необходимо отойти от простого масштабирования возможностей одиночных ИИ-систем.