Визуальные аналогии: новый подход к редактированию изображений

Использование LoRA-базиса в LoRWeB позволяет системе обобщать знания и успешно решать разнообразные задачи визуальной аналогии, включая добавление объектов, перенос стилей и макияжа, а также копирование изменений позы.

Исследователи предлагают инновационный метод, позволяющий динамически комбинировать небольшие адаптеры для достижения впечатляющих результатов в задаче визуального переноса стилей и манипулирования изображениями.

Когда достаточно думать: новый подход к логическим рассуждениям

При сохранении ветвей рассуждений на основе уверенности модели на каждом этапе расширения, модель демонстрирует способность приходить к выводам с высокой степенью достоверности.

Исследование показывает, что современные языковые модели способны самостоятельно определять оптимальную длину цепочки рассуждений для решения задач.

Искусственный интеллект на перепутье: от оценки моделей к контролю над агентами

Предлагается методологический каркас для систематической оценки систем искусственного интеллекта, обеспечивающий структурированный подход к анализу и улучшению их функциональности.

Статья посвящена эволюции методов оценки искусственного интеллекта и необходимости разработки надежных инструментов для измерения и управления все более сложными автономными системами.

Поиск оптимальных ответов: новый взгляд на декодирование языковых моделей

Предложенная схема декодирования рассматривает процесс генерации текста как задачу оптимизации, обобщая стандартные стратегии, используемые в больших языковых моделях, и позволяя восстановить их как частные случаи при грамотном выборе параметров λ, [latex]\Omega(q)[/latex] и [latex]\mathcal{C}\_{t}[/latex].

В статье представлена унифицированная структура для декодирования в языковых моделях, рассматривающая этот процесс как задачу оптимизации на вероятностном симплексе.

Видео без границ: Vision Transformer для сегментации и анализа движения

Современные методы видеосегментации, представленные, например, архитектурой CAVIS, уступают упрощенному подходу VidEoMT, использующему исключительно энкодер и опирающемуся на возможности предварительно обученных vision foundation models вместо ручной настройки компонентов, что позволяет добиться эффективности благодаря силе масштабного обучения и контекстно-зависимых механизмов [latex]TF[/latex] и [latex]CA[/latex].

Новый подход позволяет использовать стандартные Vision Transformer модели не только для распознавания изображений, но и для высокоточной сегментации видео и отслеживания объектов во времени.

Языковые модели на службе науки: новый подход к открытию моделей

Модель ModelSMC, вдохновлённая последовательным Монте-Карло (SMC), итеративно уточняет начальную модель посредством отбора проб с использованием большой языковой модели (LLM) и взвешивания на основе оценки правдоподобия, стремясь к сходимости к неизвестному процессу генерации данных [latex]p(m|{\bm{x}}\_{o})[/latex] в областях высокой плотности, что позволяет автоматизировать обнаружение моделей на основе текстовых формулировок задач и контекстных данных.

Исследователи предлагают инновационный метод автоматического обнаружения научных моделей, основанный на возможностях больших языковых моделей и принципах вероятностного программирования.

Обучение языковых моделей: новый подход к стабильности

Обучение модели Qwen3-30B-A3B-Base с использованием VESPO демонстрирует стабильность даже при расхождении между процессами обучения и инференса, а сочетание VESPO с R2 позволяет достичь наилучших результатов.

Исследователи предлагают алгоритм, позволяющий стабилизировать процесс обучения больших языковых моделей с использованием методов обучения с подкреплением.

Кто несет ответственность за ИИ: новый взгляд на причинно-следственные связи

Статья предлагает концепцию ‘Операционной Субъектности’ для определения ответственности за действия искусственного интеллекта, не прибегая к наделению ИИ правовым статусом.