Обучение через взаимодействие: как опыт экспертов ускоряет прогресс

Наблюдаемые траектории агента, представленные в виде последовательностей, демонстрируют, как модель обрабатывает полные пути движения, выделяя под-траектории на каждом временном шаге для более точного анализа и управления поведением.

Новое исследование показывает, что модели машинного обучения могут значительно улучшить свои навыки, анализируя записи диалогов между экспертами и новичками в процессе обучения.

Автоматизация исследований в машинном обучении: новый горизонт

Автономный агент AiScientist, работая над задачей выявления оскорблений в рамках MLE-Bench Lite, провёл 74 итерации экспериментов без участия человека за 23 часа, увеличив метрику валидационной AUC с 0.903 до 0.982 благодаря 18 наиболее успешным обновлениям, демонстрируя способность к самостоятельному улучшению производительности в задачах машинного обучения.

В статье представлена система AiScientist, позволяющая автоматизировать длительные исследовательские циклы в машинном обучении и повысить эффективность как воспроизведения существующих работ, так и поиска новых улучшений.

Смысловая Гармония: Обеспечение Безопасности Больших Языковых Моделей

Рамка для семантического выравнивания, не зависящего от языка (LASA), извлекает скрытые состояния из идентифицированного семантического узкого места и обрабатывает их с помощью интерпретатора семантической безопасности, используя полученные семантические сигналы, релевантные для безопасности, для управления последующей генерацией ответа и обеспечения надежной обобщенности безопасности между языками.

Новый подход к обеспечению безопасности больших языковых моделей фокусируется на выравнивании их понимания безопасности со смысловыми представлениями, не зависящими от языка.

Разумные машины: Как обучить большие языковые модели мыслить?

В обучении с подкреплением, основанном на подсказках, возникают три ключевые проблемы: резкое улучшение производительности при появлении даже короткого сегмента полезной подсказки, возрастающая неоднозначность и расширение пространства поиска при использовании более длинных или абстрактных подсказок, а также компромисс между эффективностью подсказки и возрастающими вычислительными затратами, связанными с использованием моделей-учителей или многоступенчатой курацией.

Новая методика KnowRL позволяет значительно улучшить способность больших языковых моделей к рассуждениям, используя обучение с подкреплением и тщательно отобранные знания.

Искусственный интеллект на дорогах: моделирование смешанного трафика будущего

Разработана таксономия методов искусственного интеллекта, предназначенная для моделирования транспортных потоков со смешанным уровнем автоматизации, что позволяет систематизировать и анализировать различные подходы к управлению сложными транспортными сценариями.

Обзор современных методов искусственного интеллекта, позволяющих создавать реалистичные симуляции дорожного движения с участием как автономных, так и управляемых человеком транспортных средств.

Реалистичные миры для ИИ: новый симулятор на базе Gaussian Splatting

Платформа Habitat-GS, использующая 3DGS и динамические гауссовские аватары, обеспечивает более реалистичное и детализированное моделирование сред для обучения навигационных агентов, сохраняя высокочастотные визуальные детали и эффекты, зависящие от точки зрения, в отличие от традиционных симуляторов на основе полигональных сеток, и тем самым способствуя разработке более устойчивых и адаптивных систем автономной навигации.

Разработчики представили Habitat-GS — платформу для обучения ИИ-агентов навигации в фотореалистичных 3D-средах, созданных с помощью передовой технологии Gaussian Splatting.

Скрытая уверенность: как большие языковые модели оценивают собственные ответы

Исследование производительности многослойных перцептронов (MLP) в задачах математического рассуждения на наборах данных GSM1K и MATH демонстрирует, что увеличение выразительности зондов не выявляет скрытой привилегированной информации; внешние модели по-прежнему остаются эффективными предикторами, что указывает на ограниченность улучшения производительности за счет простого увеличения сложности зондирования.

Новое исследование показывает, что модели искусственного интеллекта обладают внутренним пониманием своей собственной точности, которое часто теряется из-за общего согласия между ними.

Самообучающаяся лаборатория: Искусственный интеллект на пути к новым материалам

Исследователи разработали автоматизированную платформу, управляемую ИИ, для синтеза и анализа сложных соединений, открывая новые возможности для материаловедения.

Медицинские изображения в новом разрешении: подход на основе доменных представлений

Многомасштабное сравнение скрытых представлений выявило, что MedVAE обеспечивает более высокую степень соответствия между скрытыми представлениями реконструированных и исходных изображений (измеренная с помощью PSNR и косинусной близости) на всех уровнях пространственного понижения разрешения (от [latex]64\times 64[/latex] до [latex]1\times 1[/latex]) для данных МРТ коленного сустава, мозга и рентгеновских снимков грудной клетки, подтверждая, что специализированное для предметной области скрытое пространство лучше сохраняет информацию о высокой разрешающей способности на протяжении всей пространственной иерархии.

Новое исследование показывает, как использование специализированных автоэнкодеров позволяет значительно улучшить качество восстановления медицинских изображений.