Самообучение языковых моделей: новый подход к решению сложных задач

Рамка совместной эволюции при обучении во время тестирования (TTCS) оптимизирует как синтезатор, генерирующий синтетические вопросы на основе тестовых с использованием шаблонов и вознаграждения за качество вопросов, так и решатель, осуществляющий онлайн самоэволюцию на смеси тестовых и синтетических вопросов посредством самоконтролируемого вознаграждения за согласованность, что достигается с помощью алгоритма GRPO в обоих случаях.

Исследователи разработали инновационную систему, позволяющую большим языковым моделям самостоятельно улучшать свои навыки решения математических задач, не требуя внешнего контроля или обучения на размеченных данных.

Искусственный интеллект: между мифом и реальностью

Статья предлагает критический анализ доминирующих нарративов об искусственном интеллекте, выявляя скрытые механизмы власти и отсутствие технической обоснованности.

Автопилот будущего: где мы сейчас и куда двигаться?

В области автономного вождения реальный мир характеризуется распределением сценариев типа «длинный хвост», где наряду с часто встречающимися ситуациями присутствует огромное количество редких и постоянно возникающих новых, обусловленных открытостью и непредсказуемостью окружающей среды.

В статье анализируются ключевые препятствия на пути к созданию полностью автономных транспортных средств и рассматриваются перспективные подходы, основанные на искусственном интеллекте и новых архитектурах.

Обучение потоковых моделей: от редких к плотным сигналам вознаграждения

Существующие подходы ограничиваются предсказанием единого, разреженного сигнала вознаграждения в конце траектории шумоподавления, что приводит к неоптимальной оптимизации промежуточных шагов, в то время как DenseGRPO оценивает вознаграждение для каждого шага процесса шумоподавления, значительно уплотняя обратную связь и повышая эффективность обучения.

Новый подход позволяет более эффективно настраивать потоковые модели, используя плотные сигналы вознаграждения и оптимизируя процесс исследования пространства решений.

Искусственный интеллект в коде: Новый взгляд на автоматизацию разработки

В рамках IDE-Bench каждый этап выполнения задачи изолирован в Docker-контейнере, где агент, будь то большая языковая модель или базовый оракул, взаимодействует с инструментами IDE; все эти взаимодействия фиксируются, а после завершения работы оценка производится посредством запуска тестового набора и сравнения изменений в коде, полученных с помощью `git diff`, с эталонным решением.

Исследователи представили комплексный инструмент для оценки возможностей ИИ-агентов в решении реальных задач программирования и автоматизации рутинных операций.

Распознавание медицинских процедур: новый взгляд на анализ видео

В представленном подходе к распознаванию деятельности медперсонала используется большая языковая модель (LLM) в качестве центрального элемента интерпретации, что позволяет отойти от традиционных моделей, ориентированных на выполнение отдельных задач, и обеспечивает прозрачность и надёжность системы распознавания.

Исследователи разработали систему, способную автоматически определять и объяснять процесс отсасывания содержимого дыхательных путей по видеозаписи, что открывает новые возможности для обучения и контроля качества медицинских процедур.

Судебные баталии ИИ: Новый подход к прозрачности решений

В рамках разработанной системы моделирования взаимодействия многоагентных систем AgenticSimLaw, протокол структурированного семиходового взаимодействия включает в себя как конфиденциальную разработку стратегии каждым агентом, так и публичные заявления в ходе дебатов, при этом все взаимодействия и обновления убеждений фиксируются для обеспечения полной прозрачности и возможности аудита.

Исследователи разработали систему моделирования судебных дебатов с участием нескольких искусственных интеллектов для повышения надежности и объяснимости прогнозов в сложных задачах, таких как оценка риска рецидива.

Изображения с голосом: Улучшение классификации с помощью синтетических описаний

Предлагаемый подход включает в себя генерацию синтетического мультимодального набора данных с использованием больших мультимодальных языковых моделей, последующую контролируемую контрастную настройку, использующую как пары «изображение-подпись», так и информацию о классах, и, наконец, вывод усредненных по классам текстовых вложений.

Новый подход позволяет повысить точность распознавания изображений, преобразуя одномодальные данные в многомодальные с использованием генеративных языковых моделей.

Раскрывая скрытую логику: проверка причинно-следственных рассуждений языковых моделей

Символический верификатор оценивает семантическую эквивалентность причинно-следственных выражений, сгенерированных моделью, и эталонных данных в рамках заданного направленного ациклического графа (DAG), используя правила do-calculus и вероятностные правила для выявления формальной эквивалентности, в отличие от простого сопоставления строк.

Новый подход позволяет оценить, насколько правильно языковые модели выстраивают причинно-следственные связи, выходя за рамки поверхностного анализа.