Самообучающиеся агенты: как повысить надёжность ИИ-исследователей

Результаты тестирования модели DeepVerifier-8B на наборе данных GAIA демонстрируют масштабируемость процесса верификации и превосходство над другими открытыми моделями после десяти итераций верификации и обратной связи, что подтверждается анализом производительности на выборке из 165 примеров.

Новая методика позволяет автоматически оценивать и улучшать работу ИИ-агентов, проводящих научные исследования, выявляя ошибки и адаптируясь в процессе работы.

Лица сквозь призму моделей: оценка возможностей искусственного интеллекта

Многомодальные большие языковые модели (MLLM) демонстрируют возможность гетерогенного распознавания лиц, открывая новые перспективы в задачах, требующих анализа визуальной информации и лингвистического контекста.

Новое исследование оценивает, насколько хорошо современные мультимодальные модели справляются с распознаванием лиц в условиях различных спектральных искажений.

Искусственный разум: Нет доказательств самосознания в современных языковых моделях

По мере увеличения размера модели наблюдается закономерность: для вопросов, касающихся людей, более крупные модели увереннее приписывают им сознание, в то время как для вопросов о больших языковых моделях и о самой модели Qwen демонстрирует возрастающую уверенность в отрицании сознания, тогда как модели Llama показывают первоначальный рост уверенности при увеличении размера с 3B до 8B, после чего стабилизируются, что указывает на различные подходы к определению сознания в зависимости от объекта оценки и архитектуры модели.

Новое исследование ставит под сомнение способность больших языковых моделей сообщать о собственном самосознании и правдивости их ответов.

Адаптивное распознавание речи: обучение без забывания в условиях ограниченных ресурсов

Предлагаемая схема непрерывного обучения демонстрирует возможность адаптации системы к новым данным без катастрофического забывания ранее полученных знаний, что достигается за счёт динамической реструктуризации нейронной сети и избирательного сохранения ключевых признаков.

Новый подход позволяет системам распознавания речи непрерывно обучаться новым командам и адаптироваться к меняющимся условиям, не теряя при этом эффективности и скорости работы.

Герои романа: вычислительный анализ значимости персонажей

Сеть персонажей романа «Гордость и предубеждение» демонстрирует три различных способа визуализации связей между героями, позволяя проанализировать структуру взаимоотношений и выявить ключевые узлы влияния.

Новое исследование предлагает подход к определению ключевых персонажей в художественной литературе, выходящий за рамки простого подсчета взаимодействий.

Самообучающиеся данные: новый подход к улучшению качества наборов данных

В рамках разработанной структуры Ambient Dataloops, модель диффузии обучается на зашумленных данных (зеленый цвет), полученных на каждом этапе цикла, а затем используется для улучшения этих данных посредством апостериорной выборки (синий цвет), позволяя итеративно повышать качество и точность модели.

Исследователи предлагают инновационный метод повышения точности и надежности моделей машинного обучения за счет итеративного улучшения самих данных.

Память как ключ к пониманию данных: новый подход к Text-to-SQL

Архитектура AgentSM использует траектории, хранящиеся в структурированной семантической памяти, для обеспечения функционирования системы.

Исследователи предлагают инновационную систему, использующую структурированную семантическую память для повышения эффективности и точности преобразования естественного языка в SQL-запросы.