Обучение агентов: Масштабный видео-набор данных для автоматизации работы с компьютером

Комплекс CUA-Suite представляет собой всесторонний набор данных, включающий в себя траектории взаимодействия пользователей с графическим интерфейсом, прошедшие экспертную проверку и аннотацию ключевыми кадрами, ограничивающими рамками и журналами действий, что позволяет оценить возможности агентов по взаимодействию с компьютером, благодаря базе данных GroundCUA, содержащей 3,6 миллиона аннотаций, и видеоматериалу VideoCUA, охватывающему 55 часов реальных действий пользователей.

Представлен CUA-Suite — обширный корпус видео-демонстраций, призванный значительно упростить разработку интеллектуальных агентов, способных эффективно взаимодействовать с десктопными приложениями.

Искусственный интеллект как исследователь: Автоматический поиск алгоритмов обучения

В условиях ограничения длины наблюдается компромисс между точностью и длиной, демонстрирующий, что стремление к большей точности неизбежно ведет к увеличению длины, а сокращение длины - к снижению точности.

Новая методика позволяет искусственному интеллекту самостоятельно разрабатывать и совершенствовать алгоритмы обучения, превосходя существующие решения в сложных задачах.

Игры показывают интеллект: Новый тест для AI в динамичных средах

Процесс создания эталонного набора данных для оценки моделей включает в себя плотное временное аннотирование игровых видеороликов по шести типам объектов, использование отрицательных меток для исключения ложных срабатываний, генерацию пар вопросов-ответов на основе комбинаторных шаблонов и последующую проверку качества, что позволяет проводить детальный анализ галлюцинаций в моделях [latex] QA [/latex].

Ученые разработали сложный бенчмарк, проверяющий способность искусственного интеллекта понимать действия и решения виртуальных агентов в быстро меняющихся игровых ситуациях.

Автоматизация Рутинных Задач в Здравоохранении: Новый Подход

В рамках разработанной архитектуры CarePilot, иерархическое принятие решений в длительных медицинских сценариях осуществляется посредством многоагентного подхода

Исследователи представили CarePilot — систему, способную самостоятельно выполнять сложные задачи в медицинском программном обеспечении, значительно упрощая работу персонала.

Искусственный интеллект как научный руководитель: новый подход к автоматизации исследований

Искусственный интеллект, функционирующий как динамический направленный ациклический граф с централизованной моделью устойчивого исследовательского мира [latex]\mathcal{W}[/latex], обеспечивает одновременный доступ и модификацию данных для всех агентов, при этом консенсус достигается посредством механизма, описанного уравнением Eq.4, а самокорректирующийся цикл, реализуемый в соответствии с Eq.7, запускает обратную маршрутизацию при обнаружении расхождений.

В статье представлена система, способная самостоятельно планировать и проводить научные исследования, опираясь на постоянно обновляемую модель знаний.

На грани хаоса: как языковые модели обретают способность рассуждать

В ходе исследования обучения языковых моделей [latex]PLDR-LLMs[/latex] в условиях, близких к критическим и субкритическим, наблюдались “драконьи короли” - нестабильные фазы, проявляющиеся в колебаниях кривых потерь и точности, усредненных по 2000 шагов, что указывает на чувствительность процесса обучения к незначительным изменениям параметров.

Новое исследование показывает, что языковые модели, обученные в условиях самоорганизованной критичности, демонстрируют неожиданные способности к логическому выводу и дедуктивному мышлению.

Сеть, управляемая интеллектом: новые возможности для экспериментов

AgenticNet, разработанный с использованием агента кодирования на основе искусственного интеллекта[1], представляет собой систему, созданную посредством автоматизированного программирования.

Исследователи представляют AgenticNet — инструмент, использующий возможности искусственного интеллекта для создания гибких и эффективных гибридных сетевых экспериментов.

Искусственный интеллект в действии: как расширяется сфера возможностей?

Географическое распределение загрузок пакетов, используемых AI-агентами, демонстрирует концентрацию активности в Северной Америке и Западной Европе, при этом в период с ноября 2024 по октябрь 2025 года зафиксированы значительные колебания долей загрузок - от роста до падения на несколько процентных пунктов - на основе анализа [latex]6.73[/latex] миллионов загрузок с [latex]528[/latex] серверов управления пакетами, имеющих данные о местоположении.

Новое исследование анализирует 177 000 инструментов, используемых ИИ-агентами, чтобы понять, как быстро растет их способность взаимодействовать с миром.

Искусственный интеллект на посту финансового директора: реальность или иллюзия?

Представлена общая схема эталонного теста EnterpriseArena, демонстрирующая архитектуру и ключевые компоненты для оценки производительности и масштабируемости систем в сложных корпоративных средах.

Новое исследование ставит под сомнение способность современных моделей искусственного интеллекта эффективно управлять финансовыми ресурсами в условиях постоянно меняющейся бизнес-среды.

Роботы учатся действовать в реалистичном мире: новая модель для управления манипуляциями

Исследователи представили ABot-PhysWorld — модель, способную генерировать правдоподобные видеоролики манипуляций роботами, учитывающие законы физики и позволяющие контролировать действия.