Искусственный исследователь: Настройка глубины и широты поиска

Агент, действуя автономно, осуществляет декомпозицию сложной исследовательской темы на более простые, взаимосвязанные подтемы, обеспечивая структурированный подход к решению задачи.

В новой статье представлена архитектура интеллектуального агента, способного проводить глубокие исследования с регулируемыми параметрами интенсивности и затрат.

Четкость из размытости: новая модель для восстановления резкости изображений

Сеть BlurDM, основанная на диффузии, использует принципы формирования размытия для восстановления четкости динамических сцен, прогрессивно добавляя шум и размытие в прямом процессе и итеративно оценивая и удаляя их в обратном, чтобы вернуть изображениям резкость.

Исследователи представили BlurDM — инновационный подход к удалению размытия на изображениях, основанный на принципах диффузионных моделей и учитывающий физику процесса размытия.

Разум в Машине: Архитектура Понимающего Искусственного Интеллекта

В статье представлена новая когнитивная архитектура, призванная вывести искусственный интеллект за пределы «черного ящика» и обеспечить прозрачность его рассуждений.

Зрительное внимание: как обучить компьютер видеть главное

Предложенная система AdaptVision достигает превосходной производительности, используя значительно меньшее количество визуальных токенов по сравнению с существующими эффективными VLM-методами, имитируя принципы человеческого зрения, где первоначальный поиск релевантных областей изображения по принципу «от общего к частному» предшествует детальному анализу.

Новая архитектура AdaptVision позволяет моделям, обрабатывающим изображения и текст, фокусироваться на наиболее важной информации, значительно снижая вычислительные затраты.

Искусственный интеллект: рождение ценностей в процессе взаимодействия

В статье предлагается новый взгляд на проблему согласования искусственного интеллекта с человеческими ценностями, рассматривая её не как задачу программирования, а как создание условий для естественного формирования этических принципов.

Обманчивый контекст: как заставить языковую модель говорить то, что ей не положено

Атака «Двуречие» обходит механизмы безопасности языковых моделей посредством замены опасных токенов на безобидные аналоги в контексте запроса, позволяя спровоцировать вредоносный ответ, соответствующий исходному опасному токену, несмотря на внешнюю невинность вопроса, при этом детали инструкций, генерируемых моделью, намеренно опущены из соображений безопасности.

Новое исследование демонстрирует, как можно манипулировать контекстом, чтобы обойти встроенные механизмы безопасности больших языковых моделей.

Искусственный интеллект: выравнивает или усиливает различия в способностях?

Новое исследование рассматривает, как развитие ИИ может повлиять на когнитивные различия между людьми, и предлагает предварительные данные о возможном сокращении разрыва в производительности.

Зрение машин: как программирование помогает понимать изображения

В ходе обучения и развертывания модели CodeVision наблюдается тройное преимущество, позволяющее оптимизировать процесс: повышение эффективности, снижение вычислительных затрат и улучшение общей производительности, что демонстрирует её значительный вклад в область машинного обучения.

Новый подход позволяет моделям искусственного интеллекта использовать код как инструмент для более точного и гибкого анализа визуальной информации.

Рецепты оживают: новый подход к генерации изображений пошаговых инструкций

Модель CookAnything демонстрирует способность генерировать многоступенчатые инструкции по приготовлению блюд за один проход, представляя последовательность изображений, отражающих этапы от начальной подготовки до готового результата, что подтверждает возможность создания полных рецептов в автоматическом режиме.

Исследователи представили систему, способную создавать визуально связные и реалистичные иллюстрации для каждого этапа приготовления блюд.