Визуальная навигация: новый взгляд на обучение агентов

Агент SeeNav, в отличие от предшествующих работ в области VLN, использующих одиночные изображения в качестве входных данных и методы вроде GRPO или GiGPO для обучения с подкреплением, разработан с использованием двухканального визуального ввода и визуальных подсказок для улучшения визуального модуля в условиях переноса обучения, а также предлагает SRGPO - метод эффективного введения сигналов вознаграждения за счет случайной группировки шагов в процессе обучения с подкреплением.

Исследователи предлагают инновационный подход к обучению агентов, способных ориентироваться в пространстве, используя визуальные подсказки и оптимизацию стратегии действий.

Цифровой патолог под рукой: Искусственный интеллект в каждом анализе

Новая платформа позволяет проводить анализ гистологических изображений с помощью искусственного интеллекта непосредственно на обычном компьютерном оборудовании, открывая новые возможности для диагностики.

Оптимизация регистрации облаков точек на встраиваемых GPU: динамическое распределение памяти

В исследовании сравнивается потребление памяти при использовании различных стратегий расширения: для модели TUM (состоящей из 226 тысяч точек) оригинальный VANICP использует монолитное непрерывное распределение, обеспечивающее прямое адресование, в то время как предложенный метод применяет сегментированную стратегию на основе указателей, полагающуюся на косвенное адресование.

Новая стратегия динамического выделения памяти позволяет существенно ускорить процесс регистрации облаков точек на встраиваемых графических процессорах, сохраняя высокую производительность.

Юридический помощник в сети: Искусственный интеллект на службе правосудия

На специально созданной тестовой площадке «legal-agent-sandbox» система LegalWebAgent демонстрирует способность автономно ориентироваться на веб-сайтах и выполнять задачи по заполнению онлайн-форм посредством последовательности действий.

Новое исследование демонстрирует, как возможности больших языковых моделей могут быть использованы для создания автономных веб-агентов, способных упростить доступ к юридической информации и помощи.

Обучение диффузионных моделей с подкреплением: новый подход к оптимизации вознаграждений

Исследователи предлагают инновационную методику, позволяющую точно настраивать диффузионные модели с использованием алгоритмов обучения с подкреплением и смягчающих техник для предотвращения переобучения.

Личный помощник и конфиденциальность: как научить ИИ понимать ваши границы

Персональный агент, действуя от имени пользователя, оценивает уместность передачи данных третьей стороне для выполнения запроса, опираясь на накопленную базу знаний, содержащую историю предыдущих решений пользователя относительно подобных запросов на обмен информацией.

Новая разработка позволяет искусственным интеллектам принимать более обоснованные решения о защите личных данных, учитывая индивидуальные предпочтения пользователя.