Безопасные агенты: символьные ограничения для надежного ИИ

Распределение применимых символических ограничений для обеспечиваемых политик демонстрирует их вариативность на трех сравнительных эталонных показателях, подчеркивая возможность адаптации к различным контекстам и требованиям.

Новое исследование показывает, что простые символьные ограничения могут значительно повысить безопасность и надежность ИИ-агентов, не снижая при этом их полезность.

Пространственное мышление машин: генерация 3D-планировок нового уровня

В рамках разработанной системы LaviGen, генерация трёхмерной планировки осуществляется как авторегрессивный процесс, при котором на основе инструкций, закодированных языковой моделью, текущее состояние сцены и размещаемый объект используются для формирования обновлённого состояния, а высокоточная планировка достигается путём вычисления пространственной разницы между текущим и обновлённым состояниями для определения области размещения и подгонки параметров объекта.

Исследователи представили LaviGen — систему, способную создавать реалистичные и логичные 3D-сцены, используя передовые методы машинного обучения и принципы геометрической организации пространства.

От замысла к тексту: как искусственный интеллект помогает в академической работе

Дополнение WriteFlow для Google Docs предоставляет пользователям голосового помощника и боковую панель, включающую страницы «Задача по написанию», «Чат с ИИ» и «Мои цели», позволяя обсуждать направления работы, генерировать цели для планирования, отслеживания и мониторинга процесса написания академических текстов.

В статье рассматривается, как инструменты на базе ИИ могут поддерживать писателей, структурируя процесс работы и помогая достигать поставленных целей.

Видеомонтаж по запросу: Новый стандарт оценки качества

Разработан комплекс [latex] VEFX [/latex], включающий в себя аннотированный набор данных из 5049 примеров видеомонтажа, охватывающих 9 категорий и 32 подкатегории, оцениваемых по трем независимым параметрам - соответствию инструкции, качеству рендеринга и уникальности монтажа, а также специализированную модель вознаграждения для оценки качества видеомонтажа и эталонный набор из 300 тщательно подобранных пар видео-подсказок, предназначенный для стандартизированного сравнения систем редактирования.

Исследователи представляют комплексную платформу для оценки качества видеомонтажа и визуальных эффектов, основанную на четком следовании инструкциям и реалистичности результата.

Эволюция машин: Общие закономерности с миром живых организмов

В процессе эволюции, как искусственного интеллекта, так и биологических организмов, наблюдается сходимость архитектурных решений - четырнадцать признаков были независимо изобретены от трех до пяти раз - и закономерное увеличение доли неблагоприятных мутаций по мере созревания систем, что указывает на общую эволюционную траекторию, подтвержденную статистическим анализом ([latex]p=0.035[/latex]) и прослеживаемую на примере развития архитектур Transformer от 2017 к 2022 году.

Новое исследование показывает, что статистические паттерны эволюции проявляются как в искусственном интеллекте, так и в биологических системах, указывая на универсальные принципы адаптации.

Искажения в диффузионных моделях: как улучшить качество генерации изображений

В процессе обучения диффузионной модели отношение сигнал/шум (SNR) возмущенной выборки [latex]\bm{x}_t[/latex] строго привязано ко времени [latex]t[/latex], однако в процессе инференса, из-за ошибок предсказания сети и погрешностей дискретизации в численных решателях, SNR предсказанной выборки [latex]\bm{\hat{x}}_t[/latex] отклоняется от заданного времени [latex]t[/latex], что проявляется в более высоком значении нормы выходного шума [latex]||{\bm{\epsilon}}_{\bm{\theta}}(\bm{\hat{x}}_t,t)||_2[/latex] по сравнению с прямой выборкой [latex]||{\bm{\epsilon}}_{\bm{\theta}}(\bm{x}_t,t)||_2[/latex] при одинаковом шаге диффузии, указывая на пониженное SNR предсказанных выборок.

Новое исследование выявило систематическую ошибку в алгоритмах диффузионных моделей, приводящую к ухудшению качества сгенерированных изображений, и предлагает эффективный способ её устранения.

Музыка из Машины: Как Распознать Творение Искусственного Интеллекта

Новое исследование показывает, что определить, создана ли музыка человеком или нейросетью, можно не по её звучанию, а по неизбежным артефактам, возникающим в процессе её генерации.

Угасающая креативность: почему языковые модели теряют способность к разнообразию

Исследование прослеживает динамику разнообразия выходных данных посредством трех параллельных пост-тренировочных ветвей модели Olmo 3, выявляя конкретные этапы, причины и степень утраты вариативности.

Новое исследование показывает, что причина снижения вариативности в ответах больших языковых моделей кроется не в алгоритмах обучения, а в составе используемых данных.