Обучение агентов: Масштабный видео-набор данных для автоматизации работы с компьютером

Представлен CUA-Suite — обширный корпус видео-демонстраций, призванный значительно упростить разработку интеллектуальных агентов, способных эффективно взаимодействовать с десктопными приложениями.

![Процесс создания эталонного набора данных для оценки моделей включает в себя плотное временное аннотирование игровых видеороликов по шести типам объектов, использование отрицательных меток для исключения ложных срабатываний, генерацию пар вопросов-ответов на основе комбинаторных шаблонов и последующую проверку качества, что позволяет проводить детальный анализ галлюцинаций в моделях [latex] QA [/latex].](https://arxiv.org/html/2603.24329v1/x2.png)

![Искусственный интеллект, функционирующий как динамический направленный ациклический граф с централизованной моделью устойчивого исследовательского мира [latex]\mathcal{W}[/latex], обеспечивает одновременный доступ и модификацию данных для всех агентов, при этом консенсус достигается посредством механизма, описанного уравнением Eq.4, а самокорректирующийся цикл, реализуемый в соответствии с Eq.7, запускает обратную маршрутизацию при обнаружении расхождений.](https://arxiv.org/html/2603.24402v1/figures/pipeline.png)
![AgenticNet, разработанный с использованием агента кодирования на основе искусственного интеллекта[1], представляет собой систему, созданную посредством автоматизированного программирования.](https://arxiv.org/html/2603.23763v1/Fig1.png)
![Географическое распределение загрузок пакетов, используемых AI-агентами, демонстрирует концентрацию активности в Северной Америке и Западной Европе, при этом в период с ноября 2024 по октябрь 2025 года зафиксированы значительные колебания долей загрузок - от роста до падения на несколько процентных пунктов - на основе анализа [latex]6.73[/latex] миллионов загрузок с [latex]528[/latex] серверов управления пакетами, имеющих данные о местоположении.](https://arxiv.org/html/2603.23802v1/output/images/media/worldmap_action_server_share.png)
