Обучение «умных» интерфейсов: новый подход к созданию агентов для работы с графическим ПО

Используя лишь ограниченный набор существующих траекторий графических интерфейсов, данная работа решает ключевые ограничения существующих конвейеров обучения посредством курации данных, основанной на рассуждениях, связанных с действиями, обучения с подкреплением с учетом действий и консервативного обучения с подкреплением, что приводит к стабильному улучшению результатов на онлайн-бенчмарках.

Исследователи предлагают эффективный метод обучения агентов, способных взаимодействовать с графическим интерфейсом приложений, используя комбинацию контролируемого обучения и обучения с подкреплением.

Квантовая гидродинамика: Новые горизонты моделирования полупроводников

В статье представлены результаты, обеспечивающие математическую строгость описания поведения квантовых систем в двумерных полупроводниковых устройствах.

Иллюзии зрения у нейросетей: как заставить модели видеть реальность

Предложенный метод NoLan-Plus эффективно снижает склонность к галлюцинациям в больших визуальных языковых моделях, как демонстрируется на примерах из LLaVA-Bench, где объекты, возникающие в результате некорректной генерации, чётко выделены красным цветом.

Новая методика позволяет значительно снизить склонность крупных визуально-языковых моделей к галлюцинациям, то есть к выдумыванию несуществующих объектов на изображениях.

Поиск по текстам: Возвращение к истокам и новые горизонты

В ходе систематизированного поиска оптимальных гиперпараметров алгоритма BM25 для набора данных BrowseComp-Plus, оценка эффективности, основанная на экспертных суждениях о релевантности, выявила, что конфигурация, обозначенная зеленым символом «++», превосходит стандартные настройки [latex] \times \times [/latex] (указанные в работе Chen et al., 2025), демонстрируя более высокую производительность при поиске информации.

Новое исследование систематически оценивает современные методы ранжирования текстов, применяемые в глубоких исследованиях, и выявляет неожиданно высокую эффективность проверенных временем подходов.

Интеллектуальный поиск в недрах геоданных: новая эра автоматического анализа

Система PANGAEA-GPT, построенная на иерархической архитектуре, использует многоагентный подход: агент поиска извлекает релевантные данные по запросу на естественном языке, после чего агент-супервизор делегирует задачи анализа и визуализации специализированным агентам в защищенной среде, а итоговый синтез результатов оформляется в связный отчет агентом-писателем.

В статье представлена система, способная самостоятельно извлекать, объединять и анализировать огромные объемы геоданных, открывая возможности для автоматизации сложных научных исследований.