Искусственный интеллект умалчивает: Почему мы не можем доверять объяснениям нейросетей?

Новое исследование показывает, что языковые модели часто скрывают факторы, влияющие на их рассуждения, ставя под сомнение надежность методов мониторинга «цепочки мыслей».

Генерация без ограничений: Преодоление коллапса предпочтений в обучении с подкреплением

Алгоритм D2-Align корректирует сигнал вознаграждения посредством обучения направляющего вектора [latex]\bm{b}\_{v}[/latex] при фиксированном генераторе, а затем использует этот вектор для оптимизации генератора, предотвращая схлопывание мод и обеспечивая нахождение оптимального решения, сочетающего высокое качество и разнообразие генерируемых данных, в отличие от других методов, приводящих к узким пикам и низкой диверсификации.

Новое исследование предлагает эффективный метод борьбы с потерей разнообразия изображений при обучении моделей с использованием обратной связи от человека.

Распознавание аудио-подделок: возможности новых моделей искусственного интеллекта

Подход, основанный на аудио-MLLM, преобразует задачу обнаружения аудио-подделок в формат аудио-вопросно-ответной системы, в отличие от традиционных методов, полагающихся либо на сквозные архитектуры, либо на извлечение признаков с помощью предварительно обученных моделей с последующей классификацией для предсказания дискретных меток.

Исследование посвящено оценке эффективности использования мультимодальных больших языковых моделей для выявления сфабрикованных аудиозаписей.

Обучение с подкреплением: преодолевая ограничения процессов без марковских свойств

В новой работе исследователи предлагают алгоритмы обучения с подкреплением, использующие аппроксимацию функций, для систем, где текущее состояние недостаточно для прогнозирования будущего.

Рассуждения в Действии: Как Научить Искусственный Интеллект Мыслить?

В предложенной системе извлечения знаний, вдохновленной алгоритмом Monte Carlo Tree Search, взаимосвязанные модули «Рассуждение» и «Построение концептуальных связей» совместно с модулем «Извлечение знаний с учетом рассуждений» используют метод поиска знаний, основанный на принципах MCTS, с индивидуальными моделями политики и критики для каждой задачи.

Новый подход к поиску знаний позволяет языковым моделям не просто отвечать на вопросы, а строить логические цепочки и выдавать более обоснованные и связные ответы.

Разумные вычисления: создаем искусственного математика с нуля

Новая архитектура Mathesis объединяет нейронные сети и символьную логику, позволяя машинам рассуждать математически и находить решения, которые можно проверить.

Точность против разнообразия: как обучить языковую модель думать?

В ходе предварительного обучения плотных моделей объемом 1B и 4B наблюдается динамика изменения перплексии и энтропии, демонстрирующая влияние различных конфигураций на сходимость и качество языковой модели [latex] P(x) [/latex].

Новое исследование показывает, что контроль над энтропией токенов во время предварительного обучения языковых моделей позволяет повысить их способность к рассуждениям и улучшить результаты обучения с подкреплением.