Самообучающиеся агенты: как выявлять и исправлять ошибки

Автор: Денис Аветисян


Новая система DoVer позволяет автоматически находить и устранять неисправности в сложных системах, основанных на взаимодействии нескольких языковых моделей.

🚀 Квантовые новости

Подключайся к потоку квантовых мемов, теорий и откровений из параллельной вселенной.
Только сингулярные инсайты — никакой скуки.

Присоединиться к каналу
Предлагается методология отладки $DoVer$ (Do-then-Verify), разбивающая неудачные сессии на последовательные этапы проб, определяющая вероятные причины сбоев и генерирующая целенаправленные вмешательства, позволяющие модифицировать план или сообщения, с последующей оценкой эффективности изменений путём повторного воспроизведения траектории и измерения прогресса, где этапы планирования и перепланирования выделены синим цветом, выполнение - зеленым, предполагаемые ошибки - красным, критические сбои - темно-красным, успешное завершение - темно-зеленым, вмешательства - желтым, а новые этапы планирования и выполнения - синим и зеленым штрихом соответственно.
Предлагается методология отладки $DoVer$ (Do-then-Verify), разбивающая неудачные сессии на последовательные этапы проб, определяющая вероятные причины сбоев и генерирующая целенаправленные вмешательства, позволяющие модифицировать план или сообщения, с последующей оценкой эффективности изменений путём повторного воспроизведения траектории и измерения прогресса, где этапы планирования и перепланирования выделены синим цветом, выполнение — зеленым, предполагаемые ошибки — красным, критические сбои — темно-красным, успешное завершение — темно-зеленым, вмешательства — желтым, а новые этапы планирования и выполнения — синим и зеленым штрихом соответственно.

DoVer — это фреймворк для отладки многоагентных систем на основе больших языковых моделей, использующий активное тестирование гипотез о причинах сбоев вместо анализа логов.

Отладка многоагентных систем, основанных на больших языковых моделях (LLM), представляет собой сложную задачу из-за разветвленных трасс взаимодействия и трудностей локализации ошибок. В данной работе, ‘DoVer: Intervention-Driven Auto Debugging for LLM Multi-Agent Systems’, предложен фреймворк DoVer, который дополняет анализ логов активной верификацией гипотез об ошибках посредством целенаправленных вмешательств. Эксперименты показали, что DoVer позволяет восстановить 18-49% неудачных попыток и валидировать или опровергнуть 30-60% гипотез об ошибках, демонстрируя значительное улучшение надежности агентских систем. Каковы перспективы масштабирования подобных подходов для отладки сложных многоагентных систем и создания более устойчивых LLM-приложений?


Выявление Неопределенности в Сложных Агентных Системах

Системы, основанные на больших языковых моделях (LLM) и предназначенные для автономной работы, демонстрируют значительный потенциал в автоматизации сложных процессов. Однако, их надежность в реальных сценариях представляет собой серьезную проблему. В отличие от традиционного программного обеспечения, где ошибки можно отследить по строкам кода, в LLM-агентах сложно выявить источник неверных решений, поскольку они формируются в результате многоступенчатых рассуждений и взаимодействий между агентами. Эта непрозрачность затрудняет отладку и верификацию, особенно в ситуациях, требующих высокой степени точности и предсказуемости. По мере увеличения сложности задач и количества взаимодействующих агентов, проблема надежности становится особенно острой, ограничивая возможности широкого внедрения таких систем в критически важные области.

Традиционные методы отладки оказываются неэффективными при анализе сложных систем, состоящих из множества взаимодействующих агентов. В отличие от отладки монолитного кода, где можно последовательно проследить выполнение каждой строки, в многоагентных системах ошибки часто возникают не из-за явных дефектов в коде отдельных агентов, а из-за непредсказуемых последствий их взаимодействия и сложных цепочек рассуждений. Попытки изолировать проблему, используя стандартные отладчики, как правило, приводят к тупику, поскольку не позволяют отследить динамическое поведение всей системы и выявить причины возникновения ошибок в контексте сложного взаимодействия агентов. Необходимы принципиально новые подходы к отладке, учитывающие вероятностный характер поведения агентов и нелинейность возникающих взаимодействий, чтобы обеспечить надежность и предсказуемость сложных автоматизированных систем.

Анализ неудачной попытки в сценарии WW-HC демонстрирует неоднозначность выявления причин сбоя из-за различий в стратегиях и несогласованности действий между агентами, что затрудняет точную атрибуцию ошибок на каждом шаге.
Анализ неудачной попытки в сценарии WW-HC демонстрирует неоднозначность выявления причин сбоя из-за различий в стратегиях и несогласованности действий между агентами, что затрудняет точную атрибуцию ошибок на каждом шаге.

Интервенционное Отладочное Тестирование: Новый Подход к Поиску Ошибок

Интервенционное отладочное тестирование предполагает целенаправленное изменение поведения агента для проверки гипотез о причинах сбоев. В рамках данного подхода, исследователь намеренно вносит модификации в логику агента — например, изменяет параметры, переопределяет функции или внедряет новые правила принятия решений. После внесения изменений, система отладки анализирует реакцию агента, чтобы определить, подтверждает или опровергает вмешательство первоначальную гипотезу о причине неисправности. Этот процесс итеративно повторяется, позволяя точно локализовать и устранить источник проблем, основываясь на наблюдаемых изменениях в поведении агента.

В отличие от традиционных методов атрибуции отказов, которые полагаются на пассивное наблюдение за поведением системы с целью выявления причины сбоя, метод Intervention-Driven Debugging предполагает активное вмешательство в работу агента. Данный подход заключается в целенаправленном изменении поведения агента и анализе полученных результатов, что позволяет непосредственно проверить выдвинутые гипотезы о причинах неисправностей. Активное зондирование системы посредством модификации поведения предоставляет возможность выявить скрытые зависимости и факторы, которые остаются незамеченными при пассивном наблюдении, повышая эффективность и точность диагностики.

Веб-интерфейс системы AG2 MathChat позволяет пользователю просматривать историю математических задач, вводить новые, отслеживать многоагентный диалог с промежуточным рассуждением и редактировать сообщения или планы агентов для корректировки процесса решения.
Веб-интерфейс системы AG2 MathChat позволяет пользователю просматривать историю математических задач, вводить новые, отслеживать многоагентный диалог с промежуточным рассуждением и редактировать сообщения или планы агентов для корректировки процесса решения.

DoVer: Автоматизация Отладки посредством Целенаправленных Интервенций

Фреймворк DoVer использует сегментацию проб и контрольные точки (checkpointing) для воспроизведения и анализа выполнения агентов. Сегментация проб разбивает выполнение агента на логические сегменты, что позволяет изолировать и повторно запускать отдельные части процесса. Контрольные точки, в свою очередь, сохраняют состояние агента в ключевые моменты выполнения, обеспечивая возможность возобновления с сохраненной точки, а не с самого начала. Комбинация этих методов позволяет DoVer эффективно отлаживать сложные процессы, идентифицировать причины сбоев и проводить детальный анализ поведения агента, избегая необходимости полного повторного выполнения проб.

В рамках DoVer, валидация гипотез используется для определения первопричины сбоев в работе агентов. Этот процесс включает в себя формулировку предположений о причинах неудач, последующую проверку этих предположений на основе данных, полученных в ходе воспроизведения и анализа выполненных проб, и, как результат, повышение точности диагностики. Набор данных AssistantBench и GAIA продемонстрировал восстановление от 18% до 28% неудачных проб после валидации гипотез, а на датасете GSMPlus этот показатель достиг 49%. В значительной части случаев — от 15% до 67% в зависимости от набора данных — гипотезы были либо подтверждены, либо опровергнуты, что свидетельствует об эффективности подхода к выявлению причин сбоев.

Эффективность DoVer была продемонстрирована на разнообразных наборах данных, включая AssistantBench, GAIA и GSMPlus. На этих данных удалось восстановить от 18% до 28% неудачных попыток, при этом на наборе GSMPlus показатель восстановления достиг 49%. В значительной части случаев, от 15% до 67% в зависимости от набора данных, DoVer смог подтвердить или опровергнуть выдвинутые гипотезы о причинах сбоев, что свидетельствует о способности системы к диагностике и локализации проблем.

Сегментатор пробных эпизодов декомпозирует полную сессию на этапы планирования и выполнения.
Сегментатор пробных эпизодов декомпозирует полную сессию на этапы планирования и выполнения.

Анализ Взаимодействий Агентов и Гибкость Фреймворка: Доказательство Практической Ценности

Эксперименты, проведенные с использованием многоагентных фреймворков, таких как Magnetic-One (M1) и AutoGen2 (AG2), наглядно демонстрируют адаптивность DoVer к различным архитектурам. Система успешно интегрировалась и функционировала в обеих средах, подтверждая свою гибкость и способность к взаимодействию с агентами, организованными по различным принципам. Достигнутая совместимость указывает на то, что DoVer не зависит от конкретной реализации многоагентной системы, а может быть эффективно использован в широком спектре приложений, где требуется координация и взаимодействие между интеллектуальными агентами. Этот аспект особенно важен для создания масштабируемых и универсальных решений в области искусственного интеллекта.

В ходе экспериментов с платформой AutoGen2 продемонстрирована способность системы эффективно отлаживать сложные роли и процессы сбора информации благодаря использованию специализированных агентов. Агент “Оркестратор” координирует работу других агентов, обеспечивая последовательное выполнение задач, в то время как агент “WebSurfer” самостоятельно осуществляет поиск и извлечение данных из сети Интернет. Такая модульная архитектура позволяет DoVer не только выявлять ошибки в работе отдельных агентов, но и оптимизировать взаимодействие между ними, значительно повышая надежность и эффективность системы в целом. Способность к адаптации и самоотладке делает DoVer перспективным инструментом для решения широкого спектра задач, требующих сложной координации и обработки информации.

Несмотря на присущую субъективность в процессе разметки эталонных данных, система DoVer демонстрирует устойчивое улучшение способности к восстановлению после сбоев в сравнении с базовыми методами. Исследование показало, что даже при наличии неточностей в исходных аннотациях, DoVer эффективно адаптируется и корректирует свои действия, минимизируя негативные последствия ошибок. Это достигается за счет продвинутых алгоритмов самодиагностики и восстановления, позволяющих системе выявлять и устранять проблемы в процессе выполнения задачи, даже если информация, используемая для оценки корректности, не является абсолютно достоверной. Таким образом, DoVer подтверждает свою надежность и эффективность в ситуациях, когда получение абсолютно точных данных затруднено или невозможно.

Для извлечения контрольных точек используются подсказки, не зависящие от конкретных инструментов, ограничивающие их количество пятью или менее.
Для извлечения контрольных точек используются подсказки, не зависящие от конкретных инструментов, ограничивающие их количество пятью или менее.

Представленная работа демонстрирует стремление к повышению надёжности сложных систем, основанных на взаимодействии множества агентов, управляемых большими языковыми моделями. Подход DoVer, активно использующий интервенции для проверки гипотез о причинах сбоев, подчеркивает важность верификации, а не просто анализа логов. Как однажды заметила Барбара Лисков: «Программы должны быть спроектированы так, чтобы их можно было легко понимать, изменять и расширять». Именно к этому принципу и стремится DoVer, предлагая не просто выявлять ошибки, но и создавать системы, способные к самодиагностике и адаптации, что особенно важно для динамично меняющихся сред, характерных для многоагентных систем.

Что Дальше?

Без четкого определения задачи, любое исправление — лишь шум, умноженный на сложность. Представленная работа, безусловно, делает шаг в направлении верификации систем, основанных на LLM-агентах, но ограничивается анализом последствий сбоев. Истинное решение требует прогностической модели, способной выявлять потенциальные ошибки до их проявления, а не постфактум. Необходимо переходить от реактивного отладки к проактивному проектированию надежных систем.

Очевидным ограничением является предположение о том, что причины сбоев могут быть локализованы посредством целенаправленных вмешательств. В реальности, поведение многоагентных систем часто обусловлено сложными, нелинейными взаимодействиями, где локальное изменение может привести к непредсказуемым последствиям. Следующим этапом представляется разработка формальных методов верификации, позволяющих доказывать корректность системы в целом, а не отдельных её компонентов.

Пока же, стремление к «рабочему» решению, без доказательства его корректности, остается характерной чертой инженерной мысли. Необходимо помнить: элегантность кода — в его математической чистоте, а не в количестве пройденных тестов. Истинная отладка — это не поиск симптомов, а устранение причин.


Оригинал статьи: https://arxiv.org/pdf/2512.06749.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2025-12-09 23:22