Искусственный интеллект, который учится, проверяется и адаптируется: новый подход к надежности

Спецификация желаемого поведения агента, формализуемая как [latex]\varphi[/latex], будь то заданная пользователем или сгенерированная языковой моделью на основе опыта, автоматически преобразуется в модель вознаграждения, направляя процесс оптимизации, в то время как агент одновременно изучает представление наблюдений посредством пространства состояний верифицируемой модели мира, что позволяет обучать политику непосредственно на этом представлении и обеспечивать гарантии посредством верификатора, предоставляющего сертификаты соответствия спецификации и качества абстракции модели мира, при этом не требуя доступа к явной динамике среды, достаточно её симуляции.

Исследователи предлагают новую архитектуру для создания интеллектуальных агентов, способных к самообучению и надежной работе в динамично меняющихся условиях.

Самообучение стремится к нормальности: как InfoNCE формирует представления

В процессе обучения двуслойной MLP на наборе данных CIFAR-10 с использованием InfoNCE наблюдается увеличение гауссовости представления данных, что проявляется в снижении коэффициента вариации норм представлений (указано в уравнении [latex]Eq.20[/latex]), уменьшении статистики асимметрии из не-гауссовых значений в нормальный диапазон и устойчивом росте доли координат, успешно проходящих тест DP на нормальность.

Новое исследование показывает, что контрастивное обучение с использованием функции потерь InfoNCE приводит к формированию представлений, близких к гауссовскому распределению в высоких измерениях.

Ускорение генерации текста: новый подход к спекулятивному декодированию

При подгонке гауссовской смеси одним гауссианом, различные целевые функции демонстрируют принципиально разное поведение: в то время как расхождение Кульбака-Лейблера стремится к покрытию всей массы распределения (α=50.2%), обратное расхождение Кульбака-Лейблера проявляет тенденцию к поиску отдельных мод (α=50.8%), а максимизация общей вариации [latex]\operatorname{TV}[/latex] обеспечивает максимальное перекрытие распределений (α=60.2%), подчеркивая, что выбор целевой функции оказывает решающее влияние на конечный результат и характеристики модели.

Исследователи предлагают новый метод оптимизации скорости работы языковых моделей, основанный на прямом контроле вероятности принятия предложений.

Искусственный интеллект: курс на сверхчеловеческую адаптивность

Представленная систематизация определений общего искусственного интеллекта (AGI) и смежных концепций демонстрирует, что ключевые подходы к созданию ИИ различаются по двум основным параметрам: источнику интеллекта - от производительности и выполнения задач к обучению и адаптивности - и сфере применения - от универсальных, неограниченных областей до задач, ориентированных на человека и экономику, выделяя кластеры адаптивных генералистов, когнитивных зеркал и экономических двигателей, при этом сверхчеловеческий адаптивный интеллект (SAI) относится к ИИ, способному к адаптации и выполнению любых значимых задач как внутри, так и за пределами человеческой сферы.

Новая статья предлагает отказаться от идеи создания универсального искусственного интеллекта, подобного человеческому, и сосредоточиться на развитии систем, способных к молниеносной адаптации к любым задачам.

Восстановление изображений стало быстрее: новый подход к динамике скрытых признаков

Траектории генерации, полученные с использованием модели MIGM с изменением случайной начальной точки на промежуточных этапах, демонстрируют вариативность, обусловленную случайностью при выборе токенов, в то время как непрерывная диффузия с использованием ODE-семплинга, напротив, обеспечивает воспроизводимость траекторий из одной и той же начальной точки, исключая случайность на промежуточных шагах.

Исследователи разработали метод, значительно ускоряющий процесс генерации изображений по маске, сохраняя при этом высокое качество результата.

Искусственный интеллект: между экологией и благополучием человека

Предлагаемая схема оценки влияния искусственного интеллекта на благосостояние, адаптированная из методологии, изначально разработанной для анализа выбросов парниковых газов, классифицирует последствия по трем категориям - связанные с вычислениями, на уровне приложений и системные - при этом потенциальное повышение благосостояния отображается зелеными стрелками, а снижение - пурпурными.

Систематический анализ более 1200 исследований выявил разрозненность данных о влиянии искусственного интеллекта на устойчивое развитие и качество жизни.

Визуальное мышление машин: новый вызов для ИИ

Автоматизированный конвейер курирования данных, основанный на больших языковых моделях, позволяет подготавливать изображения с использованием фильтрации и добавлением отвлекающих элементов, оценивать степень их схожести с помощью GPT-4o для выявления ключевых различий на уровне групп и отдельных экземпляров, генерировать минимально достаточные описания, и, наконец, подтверждать точность этих описаний и наличие сложных отвлекающих элементов перед включением в итоговый набор данных.

Исследователи представили новый масштабный набор данных для оценки способности современных мультимодальных моделей понимать и интерпретировать визуальную информацию в сложных сценариях.