Веб-агент, который не теряется в сети: новый подход к автоматизации

В рамках предложенной структуры WebOperator, система исследует веб-среду посредством построения дерева поиска: начиная с начальной страницы, она кодирует состояние каждой страницы в виде узла, адаптирует пространство действий на основе текущего наблюдения и генерирует варианты действий с использованием контекстных формулировок, отсеивая невалидные с помощью правил и проверок URL; выбор оптимального действия, учитывающий специфику задачи, осуществляется после оценки вариантов с помощью модели вознаграждения, устранения дубликатов и обновления дерева поиска, а механизм спекулятивного отката обеспечивает эффективное восстановление целевого состояния до выполнения действия, что позволяет итеративно находить полное решение задачи.

Исследователи предлагают эффективный алгоритм поиска действий для автономных агентов, способных надежно взаимодействовать со сложными веб-сайтами.

Цифровая криминалистика: к стандартам прозрачности и доверия

Новый обзор посвящен необходимости разработки открытых стандартов для обеспечения прозрачности, подотчетности и целостности данных при использовании искусственного интеллекта в сфере цифровой криминалистики.

Линейное внимание без потерь: новый подход к обработке длинных последовательностей

Исследователи предлагают метод Error-Free Linear Attention (EFLA), позволяющий добиться точной интеграции динамики линейного внимания и избежать ошибок дискретизации.

Роботы, которые видят, слышат и не врежутся: новый подход к безопасной работе

Модели VLA и VLSA демонстрируют различные поведенческие характеристики, что позволяет исследовать компромиссы между точностью и вычислительной сложностью в задачах оптимизации, где $VLA$ стремится к высокой точности за счет увеличения вычислительных затрат, а $VLSA$ - к скорости за счет некоторой потери точности.

Исследователи представили фреймворк AEGIS, позволяющий моделям, объединяющим зрение, язык и действия, безопасно выполнять задачи манипулирования, избегая столкновений.

Искажение Красоты: Как AI Учит Нас, Что Есть ‘Правильное’ Искусство

Несмотря на то, что модель вознаграждения (в данном случае HPSv3) оценивает изображения, сгенерированные по запросу, ориентированному на общую эстетику, выше, чем изображения, более точно соответствующие первоначальным намерениям пользователя, это указывает на несоответствие между автоматической оценкой и истинным желаемым результатом.

Новое исследование показывает, что стремление к ‘выравниванию’ моделей генерации изображений с общепринятыми представлениями о красоте подавляет их способность создавать контент, отражающий широкий спектр эстетических предпочтений.

Искусственный интеллект на службе науки: как сформулировать значимую проблему?

Агенты искусственного интеллекта интегрируются с логикой рефлекторного управления (LRI), позволяя системе адаптироваться к непредвиденным обстоятельствам и эффективно взаимодействовать с динамичной средой.

В статье рассматривается возможность использования ИИ-агентов для улучшения процесса формулирования актуальных и значимых исследовательских задач в области разработки программного обеспечения.

Разумный диагноз: Искусственный интеллект на службе психического здоровья

Набор задач и данных, объединенных в MentraBench, представляет собой комплексную экосистему для оценки и развития многозадачных способностей языковых моделей, где каждый элемент призван спровоцировать и выявить слабые места в архитектуре и обучении, предвещая потенциальные сбои в реальных сценариях использования.

Новая разработка MentraSuite призвана улучшить способность больших языковых моделей к клиническому мышлению и оценке состояния психического здоровья.