Искусственный интеллект — Страница 118

Баланс между исследованием и использованием: Новый взгляд на обучение с подкреплением

20.12.2025 от Денис Аветисян

В процессе обучения с случайным вознаграждением, энтропия стратегии модели Qwen2.5-Math-7B демонстрирует различную динамику в зависимости от применения обрезки градиентов: необрезанное обучение может приводить к взрыву градиентов, как показано на примере R1-Distill-Llama-8B, в то время как обрезка позволяет стабилизировать процесс обучения и контролировать энтропию стратегии.

В статье рассматриваются способы оптимизации процесса обучения с подкреплением за счет регулирования стратегий исследования и использования, с акцентом на методы обрезки, энтропии и устранения ложных сигналов.

Искусственный интеллект, который знает, когда ему нужна подсказка

20.12.2025 от Денис Аветисян

В предложенной системе AdaSearch агент сначала оценивает возможность решения запроса, опираясь на имеющиеся параметрические знания, а затем, в зависимости от достаточности этих знаний, либо следует соответствующему запросу, либо переключается на поиск и рассуждения для получения окончательного ответа.

Новая система AdaSearch позволяет языковым моделям самостоятельно определять, когда следует обращаться к внешним источникам знаний для решения задач.

Законы масштабирования из данных: новый взгляд

20.12.2025 от Денис Аветисян

$При увеличении уровня шума в данных, вычисленные коэффициенты $\boldsymbol{\gamma}$ отклоняются от истинных значений $[1, 1, 0]^T$, что демонстрирует сложность выявления безразмерных групп из зашумленных экспериментальных данных, несмотря на использование ансамблевых методов для оценки неопределенности.$

В статье представлена методика извлечения фундаментальных законов, определяющих поведение сложных систем, непосредственно из экспериментальных данных.

Искусство отбора данных: Новый подход к обучению генеративных моделей

20.12.2025 от Денис Аветисян

Процесс Alchemist оптимизирует выбор обучающих данных для моделей преобразования текста в изображение путём совместной настройки оценки изображений и стратегии отбора, позволяющей эффективно сохранять информативные примеры и отсеивать избыточные, что обеспечивает высокоэффективное обучение downstream-моделей.

Исследователи представили метод, позволяющий существенно повысить эффективность обучения моделей, генерирующих изображения по текстовому описанию, за счет интеллектуального отбора наиболее полезных данных.

Геометрия Хаоса: Распознавание Образов в Сложных Системах

20.12.2025 от Денис Аветисян

Процесс, представленный на рисунке, демонстрирует применение пространств векторных полей ранга $dd$ для анализа динамики сложных систем, позволяя исследовать их поведение и выявлять ключевые закономерности.

Новый геометрический подход позволяет анализировать динамические процессы в сложных системах, не требуя предварительных знаний об их внутренней структуре.

Ожившие портреты: ускоренная анимация с FlashPortrait

20.12.2025 от Денис Аветисян

Архитектура FlashPortrait использует внедрение эмбеддингов из кодировщиков изображения и лица в блоки DiT, а для ускорения вычислений в скользящем окне предсказывает будущие латенты на основе кэшированных исторических состояний, избегая повторного обращения к DiT для шумоподавления, что позволяет эффективно генерировать длинные видео с выражением лица.

Новая технология позволяет создавать бесконечные видеопортреты в шесть раз быстрее, сохраняя при этом естественность и узнаваемость лица.

Химические формулы под контролем: Новый подход к поиску молекулярных структур

20.12.2025 от Денис Аветисян

В статье представлен инновационный метод, использующий логическое программирование для эффективного перебора возможных молекулярных структур по заданным химическим формулам.

Искусственный интеллект, который понимает и текст, и картинки: новый эталон оценки

20.12.2025 от Денис Аветисян

В исследовании представлены примеры пар предпочтений в мультимодальном наборе данных MMRB2, охватывающие четыре задачи - генерацию изображений по тексту, взаимоперемежающуюся генерацию, редактирование изображений и мультимодальное рассуждение - демонстрируя сопоставление оценок человека и модели на сложных запросах.

Исследователи представили Multimodal RewardBench 2 — комплексный инструмент для оценки моделей, способных генерировать и анализировать как текстовый, так и визуальный контент.

Разум в рамках бюджета: как заставить языковые модели мыслить эффективнее

20.12.2025 от Денис Аветисян

В исследовании продемонстрировано, что методика BRAID позволяет моделям меньшего размера достигать или превосходить производительность более крупных моделей, использующих классическое prompting, на таких сложных эталонных тестах, как $GSM-Hard$, $SCALE MultiChallenge$ и $AdvancedIF$, подчеркивая потенциал оптимизации без увеличения вычислительных ресурсов.

Новый подход к структурированию запросов позволяет значительно повысить эффективность рассуждений больших языковых моделей, снижая потребность в дорогостоящих вычислительных ресурсах.

Визуальные команды: новый подход к редактированию изображений

20.12.2025 от Денис Аветисян

Предложенная схема RePlan анализирует визуальные данные и текстовые инструкции посредством последовательного рассуждения, генерируя направляющие сигналы, привязанные к областям изображения, которые, будучи закодированы и объединены с визуальными патчами посредством механизма внимания, позволяют модели MMDiT создавать итоговое отредактированное изображение.

Исследователи представили систему RePlan, которая позволяет точно выполнять сложные инструкции по редактированию фотографий, даже в условиях загроможденных изображений и неоднозначных запросов.