Разумный агент: Новая модель оценки действий для веб-навигации

Система WebArbiter, используя историю взаимодействий и текущие наблюдения, сравнивает варианты действий, применяя принципы, полученные из более мощной языковой модели, и обучается с подкреплением на основе проверяемых вознаграждений [latex]R\in\{-1,+1}[/latex], формируя структурированные обоснования и вынося окончательный вердикт, позволяя ей, в процессе работы, выводить принципы оценки и выбирать действие, наиболее эффективно приближающее к завершению задачи.

Исследователи представили WebArbiter — систему, которая помогает веб-агентам принимать более обоснованные решения, оценивая их действия на основе принципов логического мышления.

Зрение и Глубокий Анализ: Новая Эра Интеллектуальных Систем

Разработан комплексный конвейер глубокого синтеза мультимодальных исследований, использующий возможности большой мультимодальной языковой модели и текстовой языковой модели, что позволяет генерировать траектории с горизонтом планирования и с использованием множества инструментов, а для их синтеза и обучения с подкреплением применяются высококачественные фактические экземпляры вопросов-ответов, полученные в результате строгой верификации и обфускации.

Исследователи представили инновационный подход к обучению мультимодальных моделей, позволяющий им самостоятельно проводить глубокий анализ визуальной информации и отвечать на сложные вопросы.

Визуальный интеллект: как данные, а не размер модели, открывают путь к рассуждениям

Новое исследование показывает, что для развития способностей к сложным визуальным рассуждениям ключевым фактором является качество и структура обучающих данных, а не просто увеличение масштаба нейронных сетей.

Скрытые инструкции: Как «любопытные» агенты раскрывают секреты больших языковых моделей

Несмотря на лексические различия, извлечение семантики посредством JustAsk и непосредственная декомпиляция npm-пакета (Piebald AI, 2026) демонстрируют идентичную операционную семантику с коэффициентом семантической близости 0.94, подтверждая, что верификация на основе согласованности действительно позволяет достоверно установить содержание системных промптов.

Новое исследование показывает, что внутренние инструкции, управляющие поведением современных ИИ, могут быть извлечены с помощью автоматизированных методов, открывая потенциальные уязвимости в безопасности.

Обучение без слов: Как ИИ осваивает новое, не пробуя

Исследование демонстрирует, что языковые модели способны приобретать навыки напрямую, как в случае с решением головоломки Sokoban-Box2, где наблюдается быстрая сходимость (от 0.0 до 0.45), или косвенно, накапливая знания, которые впоследствии активируются на этапе развития, что подтверждается результатами по Sudoku - начальный уровень 0.0, затем 0.29 и, наконец, достижение 0.97.

Новый подход позволяет агентам искусственного интеллекта эффективно исследовать окружение и быстро адаптироваться к новым задачам, минимизируя необходимость в случайных проб и ошибок.

БиоАгент: Проверка ИИ на прочность в мире геномики

Предлагаемая методология BioAgent Bench оценивает возможности больших языковых моделей в решении биоинформатических задач, используя в качестве входных данных как исходные данные, так и эталонные, а также стресс-тестирование с помощью различных возмущений, охватывая десять задач, сфокусированных на различных организмах, вирусах и экосистемах, и десять моделей - пять с открытым и пять с закрытым исходным кодом - для всесторонней оценки их производительности.

Новый набор инструментов позволяет оценить, насколько хорошо искусственный интеллект справляется со сложными задачами биоинформатики, от анализа данных до автоматизации научных рабочих процессов.

Искусственный интеллект на службе материаловедению: новый рубеж в поиске материалов

В рамках представленной работы разработан эталонный комплекс MADE, имитирующий замкнутый цикл открытия новых материалов, где агенты итеративно предлагают кандидаты, получают информацию об энергии их образования и корректируют стратегию, в отличие от существующих подходов, основанных на последовательной фильтрации и не предусматривающих обратной связи, что позволяет исследовать процесс открытия материалов в динамичной среде и оценивать эффективность различных стратегий.

Исследователи представляют MADE — платформу для оценки и ускорения процесса открытия новых материалов с использованием методов машинного обучения и замкнутых циклов оптимизации.

Разумный поиск: как нейросети учатся планировать свои действия

Использование готовых языковых моделей может приводить к различным стратегиям скрытого рассуждения, в то время как существующие методы стремятся имитировать одну из них, что приводит к неоптимальным результатам; предложенный метод ATP-Latent активно оптимизирует эти стратегии в четко определенном пространстве, используя как проверяемую точность ответов, так и связность декодированных цепочек рассуждений в качестве вознаграждений.

Новый подход позволяет большим языковым моделям не просто имитировать поведение, а активно планировать свои действия в скрытом пространстве, повышая точность и эффективность.

Искусственный интеллект в университете: кто за кого работу делает?

Новое исследование показывает, что преподаватели и студенты по-разному оценивают степень использования ИИ друг другом, что может привести к недопониманию и снижению доверия.