Политики в машинном разуме: Как оценить соответствие больших языковых моделей корпоративным требованиям

Система Compass, используя списки разрешенных и запрещенных элементов, формирует как основные запросы, отражающие намерения политик, так и граничные, проверяющие их пределы посредством, например, состязательных преобразований, после чего ответы чат-бота оцениваются независимой языковой моделью на предмет соответствия установленным правилам.

Новая методика позволяет проверить, насколько точно большие языковые модели соблюдают внутренние правила организации, выявляя неожиданные пробелы в их безопасности.

K-EXAONE: Новый взгляд на обработку текста на русском и корейском языках

Эффективность токенизаторов K-EXAONE и EXAONE 4.0 демонстрирует различия в количестве байт, приходящихся на один токен, в зависимости от типа обрабатываемого текста, что позволяет оценить их производительность в различных лингвистических областях.

В данной статье подробно описывается разработка K-EXAONE, мощной языковой модели, способной эффективно обрабатывать длинные тексты и демонстрировать высокую производительность в задачах, связанных с корейским языком.

Искусственный интеллект, действующий самостоятельно: новый взгляд на дистанционное зондирование

Исследования в области интеллектуального дистанционного зондирования земли включают в себя наборы данных и тесты для оценки возможностей агентов, охватывающие задачи, связанные с референтными выражениями, обнаружением изменений, классификацией сцен, геолокацией, анализом географического здоровья, пониманием городской среды, семантикой геопространственных данных, многоинструментальным рассуждением и отношениями между объектами на изображениях, что позволяет оценить прогресс в создании интеллектуальных систем анализа геопространственной информации.

В статье представлен обзор перспективного направления развития искусственного интеллекта, позволяющего автоматизировать сложные задачи анализа данных дистанционного зондирования.

Интеллектуальный ремонт кода: новый подход к автоматическому исправлению ошибок

Модели SWE-Lego демонстрируют новый уровень производительности на бенчмарке SWE-bench Verified, превосходя аналогичные системы благодаря честной оценке, свободной от манипуляций с Git, при этом комбинированный набор данных SWE-Lego обеспечивает прирост в 25.6%, а последующая донастройка SFT и интеграция TTS совместно увеличивают эффективность модели Qwen3-32B с 23.2% до 58.8%.

Исследователи представили SWE-Lego — систему, использующую передовые методы обучения с учителем для автоматического исправления ошибок в программном коде.

Наука в Поисках: Интеллектуальный Помощник для Обмена Данными

Исследование демонстрирует возможности ScienceDB AI и двух конкурирующих рекомендательных систем, основанных на агентах, в конкретном случае, что позволяет оценить их эффективность и сравнительные преимущества.

Новая система ScienceDB AI использует возможности искусственного интеллекта для упрощения поиска и рекомендаций научных данных, открывая новые возможности для исследователей.

Цифровые двойники и искусственный интеллект: новые горизонты

Цифровые двойники, представленные как развивающиеся интеллектуальные системы, проходят четыре стадии: от описания реальности с использованием искусственного интеллекта, основанного на физических принципах и наблюдаемых данных, до создания синхронизированных цифровых симуляторов посредством генеративного ИИ, затем - вмешательства в реальность с помощью предиктивного ИИ для прогнозирования, диагностики и оптимизации, и, наконец, достижения автономного управления посредством агентного ИИ, основанного на больших языковых и базовых моделях, что позволяет обобщить данную концепцию для широкого спектра прикладных областей.

В статье рассматривается интеграция цифровых двойников с технологиями искусственного интеллекта и машинного обучения для создания интеллектуальных систем, способных к моделированию, прогнозированию и автономному управлению.

Ожившие Лица: Новый Подход к Реалистичной Замене Лиц в Видео

Исследователи представили DreamID-V, систему, позволяющую создавать убедительные видеоролики с заменой лиц, преодолевая разрыв между статичными изображениями и динамичным видео.

Искусственный интеллект, действующий в мире: от архитектуры к автономности

Обучение агентов искусственного интеллекта охватывает различные механизмы, системы и базовые модели, демонстрируя всесторонний подход к развитию интеллектуальных возможностей.

В статье представлен обзор быстро развивающейся области интеллектуальных агентов, исследующих возможности создания надежных и безопасных систем, способных к долгосрочному планированию и взаимодействию с окружающей средой.