Самообучающиеся агенты: как повысить надёжность ИИ-исследователей

Новая методика позволяет автоматически оценивать и улучшать работу ИИ-агентов, проводящих научные исследования, выявляя ошибки и адаптируясь в процессе работы.

Новая методика позволяет автоматически оценивать и улучшать работу ИИ-агентов, проводящих научные исследования, выявляя ошибки и адаптируясь в процессе работы.

Новое исследование оценивает, насколько хорошо современные мультимодальные модели справляются с распознаванием лиц в условиях различных спектральных искажений.

Новое исследование ставит под сомнение способность больших языковых моделей сообщать о собственном самосознании и правдивости их ответов.

В новой работе представлена MirrorBench — платформа для строгого анализа реалистичности поведения искусственных агентов в диалоге.

Новое исследование предлагает подход к определению ключевых персонажей в художественной литературе, выходящий за рамки простого подсчета взаимодействий.

Исследователи представили модель VideoMaMa, использующую генеративные сети для точного и реалистичного выделения объектов на видео.

Исследователи предлагают инновационную систему, использующую структурированную семантическую память для повышения эффективности и точности преобразования естественного языка в SQL-запросы.

Новое исследование демонстрирует, что современные модели обработки изображений и языка испытывают трудности с планированием последовательности действий, но их можно значительно улучшить, вдохновившись принципами работы человеческого мозга.

Новое исследование выявило, как большие языковые модели могут неосознанно транслировать стереотипы об аутизме, акцентируя зависимость от нейротипичных людей.

Исследователи предлагают метод, позволяющий роботам лучше понимать инструкции и выполнять действия, минимизируя зависимость от визуальных подсказок.