Самообучающиеся агенты: как выявлять и исправлять ошибки

Автор: Денис Аветисян

Новая система DoVer позволяет автоматически находить и устранять неисправности в сложных системах, основанных на взаимодействии нескольких языковых моделей.

Предлагается методология отладки $DoVer$ (Do-then-Verify), разбивающая неудачные сессии на последовательные этапы проб, определяющая вероятные причины сбоев и генерирующая целенаправленные вмешательства, позволяющие модифицировать план или сообщения, с последующей оценкой эффективности изменений путём повторного воспроизведения траектории и измерения прогресса, где этапы планирования и перепланирования выделены синим цветом, выполнение - зеленым, предполагаемые ошибки - красным, критические сбои - темно-красным, успешное завершение - темно-зеленым, вмешательства - желтым, а новые этапы планирования и выполнения - синим и зеленым штрихом соответственно. — Предлагается методология отладки $DoVer$ (Do-then-Verify), разбивающая неудачные сессии на последовательные этапы проб, определяющая вероятные причины сбоев и генерирующая целенаправленные вмешательства, позволяющие модифицировать план или сообщения, с последующей оценкой эффективности изменений путём повторного воспроизведения траектории и измерения прогресса, где этапы планирования и перепланирования выделены синим цветом, выполнение — зеленым, предполагаемые ошибки — красным, критические сбои — темно-красным, успешное завершение — темно-зеленым, вмешательства — желтым, а новые этапы планирования и выполнения — синим и зеленым штрихом соответственно.

DoVer — это фреймворк для отладки многоагентных систем на основе больших языковых моделей, использующий активное тестирование гипотез о причинах сбоев вместо анализа логов.

Отладка многоагентных систем, основанных на больших языковых моделях (LLM), представляет собой сложную задачу из-за разветвленных трасс взаимодействия и трудностей локализации ошибок. В данной работе, ‘DoVer: Intervention-Driven Auto Debugging for LLM Multi-Agent Systems’, предложен фреймворк DoVer, который дополняет анализ логов активной верификацией гипотез об ошибках посредством целенаправленных вмешательств. Эксперименты показали, что DoVer позволяет восстановить 18-49% неудачных попыток и валидировать или опровергнуть 30-60% гипотез об ошибках, демонстрируя значительное улучшение надежности агентских систем. Каковы перспективы масштабирования подобных подходов для отладки сложных многоагентных систем и создания более устойчивых LLM-приложений?

Выявление Неопределенности в Сложных Агентных Системах

Системы, основанные на больших языковых моделях (LLM) и предназначенные для автономной работы, демонстрируют значительный потенциал в автоматизации сложных процессов. Однако, их надежность в реальных сценариях представляет собой серьезную проблему. В отличие от традиционного программного обеспечения, где ошибки можно отследить по строкам кода, в LLM-агентах сложно выявить источник неверных решений, поскольку они формируются в результате многоступенчатых рассуждений и взаимодействий между агентами. Эта непрозрачность затрудняет отладку и верификацию, особенно в ситуациях, требующих высокой степени точности и предсказуемости. По мере увеличения сложности задач и количества взаимодействующих агентов, проблема надежности становится особенно острой, ограничивая возможности широкого внедрения таких систем в критически важные области.

Традиционные методы отладки оказываются неэффективными при анализе сложных систем, состоящих из множества взаимодействующих агентов. В отличие от отладки монолитного кода, где можно последовательно проследить выполнение каждой строки, в многоагентных системах ошибки часто возникают не из-за явных дефектов в коде отдельных агентов, а из-за непредсказуемых последствий их взаимодействия и сложных цепочек рассуждений. Попытки изолировать проблему, используя стандартные отладчики, как правило, приводят к тупику, поскольку не позволяют отследить динамическое поведение всей системы и выявить причины возникновения ошибок в контексте сложного взаимодействия агентов. Необходимы принципиально новые подходы к отладке, учитывающие вероятностный характер поведения агентов и нелинейность возникающих взаимодействий, чтобы обеспечить надежность и предсказуемость сложных автоматизированных систем.

Анализ неудачной попытки в сценарии WW-HC демонстрирует неоднозначность выявления причин сбоя из-за различий в стратегиях и несогласованности действий между агентами, что затрудняет точную атрибуцию ошибок на каждом шаге.

Интервенционное Отладочное Тестирование: Новый Подход к Поиску Ошибок

Интервенционное отладочное тестирование предполагает целенаправленное изменение поведения агента для проверки гипотез о причинах сбоев. В рамках данного подхода, исследователь намеренно вносит модификации в логику агента — например, изменяет параметры, переопределяет функции или внедряет новые правила принятия решений. После внесения изменений, система отладки анализирует реакцию агента, чтобы определить, подтверждает или опровергает вмешательство первоначальную гипотезу о причине неисправности. Этот процесс итеративно повторяется, позволяя точно локализовать и устранить источник проблем, основываясь на наблюдаемых изменениях в поведении агента.

В отличие от традиционных методов атрибуции отказов, которые полагаются на пассивное наблюдение за поведением системы с целью выявления причины сбоя, метод Intervention-Driven Debugging предполагает активное вмешательство в работу агента. Данный подход заключается в целенаправленном изменении поведения агента и анализе полученных результатов, что позволяет непосредственно проверить выдвинутые гипотезы о причинах неисправностей. Активное зондирование системы посредством модификации поведения предоставляет возможность выявить скрытые зависимости и факторы, которые остаются незамеченными при пассивном наблюдении, повышая эффективность и точность диагностики.

Веб-интерфейс системы AG2 MathChat позволяет пользователю просматривать историю математических задач, вводить новые, отслеживать многоагентный диалог с промежуточным рассуждением и редактировать сообщения или планы агентов для корректировки процесса решения.

DoVer: Автоматизация Отладки посредством Целенаправленных Интервенций

Фреймворк DoVer использует сегментацию проб и контрольные точки (checkpointing) для воспроизведения и анализа выполнения агентов. Сегментация проб разбивает выполнение агента на логические сегменты, что позволяет изолировать и повторно запускать отдельные части процесса. Контрольные точки, в свою очередь, сохраняют состояние агента в ключевые моменты выполнения, обеспечивая возможность возобновления с сохраненной точки, а не с самого начала. Комбинация этих методов позволяет DoVer эффективно отлаживать сложные процессы, идентифицировать причины сбоев и проводить детальный анализ поведения агента, избегая необходимости полного повторного выполнения проб.

В рамках DoVer, валидация гипотез используется для определения первопричины сбоев в работе агентов. Этот процесс включает в себя формулировку предположений о причинах неудач, последующую проверку этих предположений на основе данных, полученных в ходе воспроизведения и анализа выполненных проб, и, как результат, повышение точности диагностики. Набор данных AssistantBench и GAIA продемонстрировал восстановление от 18% до 28% неудачных проб после валидации гипотез, а на датасете GSMPlus этот показатель достиг 49%. В значительной части случаев — от 15% до 67% в зависимости от набора данных — гипотезы были либо подтверждены, либо опровергнуты, что свидетельствует об эффективности подхода к выявлению причин сбоев.

Эффективность DoVer была продемонстрирована на разнообразных наборах данных, включая AssistantBench, GAIA и GSMPlus. На этих данных удалось восстановить от 18% до 28% неудачных попыток, при этом на наборе GSMPlus показатель восстановления достиг 49%. В значительной части случаев, от 15% до 67% в зависимости от набора данных, DoVer смог подтвердить или опровергнуть выдвинутые гипотезы о причинах сбоев, что свидетельствует о способности системы к диагностике и локализации проблем.

Сегментатор пробных эпизодов декомпозирует полную сессию на этапы планирования и выполнения.

Анализ Взаимодействий Агентов и Гибкость Фреймворка: Доказательство Практической Ценности

Эксперименты, проведенные с использованием многоагентных фреймворков, таких как Magnetic-One (M1) и AutoGen2 (AG2), наглядно демонстрируют адаптивность DoVer к различным архитектурам. Система успешно интегрировалась и функционировала в обеих средах, подтверждая свою гибкость и способность к взаимодействию с агентами, организованными по различным принципам. Достигнутая совместимость указывает на то, что DoVer не зависит от конкретной реализации многоагентной системы, а может быть эффективно использован в широком спектре приложений, где требуется координация и взаимодействие между интеллектуальными агентами. Этот аспект особенно важен для создания масштабируемых и универсальных решений в области искусственного интеллекта.

В ходе экспериментов с платформой AutoGen2 продемонстрирована способность системы эффективно отлаживать сложные роли и процессы сбора информации благодаря использованию специализированных агентов. Агент “Оркестратор” координирует работу других агентов, обеспечивая последовательное выполнение задач, в то время как агент “WebSurfer” самостоятельно осуществляет поиск и извлечение данных из сети Интернет. Такая модульная архитектура позволяет DoVer не только выявлять ошибки в работе отдельных агентов, но и оптимизировать взаимодействие между ними, значительно повышая надежность и эффективность системы в целом. Способность к адаптации и самоотладке делает DoVer перспективным инструментом для решения широкого спектра задач, требующих сложной координации и обработки информации.

Несмотря на присущую субъективность в процессе разметки эталонных данных, система DoVer демонстрирует устойчивое улучшение способности к восстановлению после сбоев в сравнении с базовыми методами. Исследование показало, что даже при наличии неточностей в исходных аннотациях, DoVer эффективно адаптируется и корректирует свои действия, минимизируя негативные последствия ошибок. Это достигается за счет продвинутых алгоритмов самодиагностики и восстановления, позволяющих системе выявлять и устранять проблемы в процессе выполнения задачи, даже если информация, используемая для оценки корректности, не является абсолютно достоверной. Таким образом, DoVer подтверждает свою надежность и эффективность в ситуациях, когда получение абсолютно точных данных затруднено или невозможно.

Для извлечения контрольных точек используются подсказки, не зависящие от конкретных инструментов, ограничивающие их количество пятью или менее.

Представленная работа демонстрирует стремление к повышению надёжности сложных систем, основанных на взаимодействии множества агентов, управляемых большими языковыми моделями. Подход DoVer, активно использующий интервенции для проверки гипотез о причинах сбоев, подчеркивает важность верификации, а не просто анализа логов. Как однажды заметила Барбара Лисков: «Программы должны быть спроектированы так, чтобы их можно было легко понимать, изменять и расширять». Именно к этому принципу и стремится DoVer, предлагая не просто выявлять ошибки, но и создавать системы, способные к самодиагностике и адаптации, что особенно важно для динамично меняющихся сред, характерных для многоагентных систем.

Что Дальше?

Без четкого определения задачи, любое исправление — лишь шум, умноженный на сложность. Представленная работа, безусловно, делает шаг в направлении верификации систем, основанных на LLM-агентах, но ограничивается анализом последствий сбоев. Истинное решение требует прогностической модели, способной выявлять потенциальные ошибки до их проявления, а не постфактум. Необходимо переходить от реактивного отладки к проактивному проектированию надежных систем.

Очевидным ограничением является предположение о том, что причины сбоев могут быть локализованы посредством целенаправленных вмешательств. В реальности, поведение многоагентных систем часто обусловлено сложными, нелинейными взаимодействиями, где локальное изменение может привести к непредсказуемым последствиям. Следующим этапом представляется разработка формальных методов верификации, позволяющих доказывать корректность системы в целом, а не отдельных её компонентов.

Пока же, стремление к «рабочему» решению, без доказательства его корректности, остается характерной чертой инженерной мысли. Необходимо помнить: элегантность кода — в его математической чистоте, а не в количестве пройденных тестов. Истинная отладка — это не поиск симптомов, а устранение причин.

Оригинал статьи: https://arxiv.org/pdf/2512.06749.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2025-12-09 23:22

🚀 Квантовые новости