Зелёные решения в машинном обучении: как сделать AI экологичнее

Новое исследование анализирует тысячи проектов с открытым исходным кодом, чтобы выявить эффективные методы снижения энергопотребления и повышения устойчивости систем машинного обучения.

Диалог в движении: Как заставить виртуального слушателя реагировать на речь

Генеративная модель, получив на вход речевое высказывание - транскрипт и/или аудиозапись, возможно, с эмоциональной окраской - способна синтезировать соответствующую последовательность движений тела слушателя, имитируя реакцию на услышанное.

Новое исследование предлагает способ реалистично моделировать невербальные реакции слушателя на высказывания говорящего, делая взаимодействие с искусственным интеллектом более естественным.

Личность из осколков: как языковые модели восстанавливают данные из анонимных источников

Агент, оперируя фрагментированной информацией из анонимизированных источников, таких как логи чат-ботов и поисковые запросы, в сочетании с сопоставимыми данными из открытых источников, способен реконструировать конкретную личность, выстраивая связную гипотезу на основе слабо выраженных сигналов и подтверждающих данных.

Новое исследование показывает, что современные языковые модели способны реконструировать личные данные, используя разрозненные подсказки, даже если исходные данные были анонимизированы.

Пространственное мышление нейросетей: как генеративные модели «видят» мир

Модель генерации демонстрирует устойчивую геометрическую согласованность при изменении угла обзора, что подтверждается высокой степенью соответствия и стабильными представлениями главных компонент, позволяя VEGA-3D преодолевать пространственную неоднозначность и точно определять области внимания на целевом объекте в соответствии с инструкцией.

Новое исследование демонстрирует, что модели, способные генерировать видео, обладают скрытым пониманием трехмерного пространства, которое можно использовать для улучшения работы систем искусственного интеллекта.

Спектроскопия и разумное объяснение: новый взгляд на данные

Предлагаемый спектроскопический пайплайн, демонстрируя поэтапную обработку данных, обеспечивает интерпретируемость на каждом шаге, позволяя выявить взаимосвязи между спектральными характеристиками и наблюдаемыми явлениями.

Исследователи предлагают новый подход к интерпретации моделей машинного обучения, работающих со спектроскопическими данными, обеспечивающий стабильность и понятность результатов.

Интеллектуальные агенты на службе образования: автоматизация исследований в сфере обучения

Новая система EDM-ARS использует возможности многоагентных систем для автоматизации полного цикла исследований в области интеллектуального анализа данных об образовании.

Кубический диффузионный синтез: новое измерение генерации изображений

Исследование демонстрирует, что кубическая дискретная диффузия, в отличие от авторегрессивных и стандартных дискретных методов, позволяет эффективно генерировать изображения за [latex]T \ll h \times w \times d[/latex] итераций благодаря мелкозернистому маскированию в трехмерном тензоре, что обеспечивает моделирование как пространственных, так и размерностных корреляций, в то время как авторегрессия становится непрактичной ([latex]h \times w \times d[/latex] шагов), а стандартная дискретная диффузия не способна улавливать внутрипозиционные зависимости.

Исследователи представили метод Cubic Discrete Diffusion (CubiD), позволяющий генерировать изображения непосредственно из высокоразмерных представлений, открывая возможности для унифицированных мультимодальных архитектур.

Восстановление 3D-моделей по одной фотографии: новый подход к движущимся объектам

Система MonoArt, использующая генератор на основе TRELLIS, реконструирует каноническую 3D-форму из единичного изображения, причём семантический рассудитель, учитывающий части объекта, формирует трипланарные вложения, а декодер движения с двойным запросом и кинематический оценщик итеративно рассуждают о движении и предсказывают параметры артикуляции на уровне частей (тип, происхождение, ось, пределы), определяя структуру кинематического дерева.

Исследователи разработали систему MonoArt, способную восстанавливать трехмерные модели сложных, сочлененных объектов, используя лишь одно изображение.