Искусственный интеллект в помощь разработчику: от поиска документации до генерации тестов

Автор: Денис Аветисян

В статье рассматриваются практические примеры использования агентного ИИ для автоматизации рутинных задач в процессе разработки программного обеспечения.

Архитектура разработанного агента для обработки документов использует компоненты, обозначенные иконкой «робот», что позволяет реализовать подход, основанный на автономных агентах для решения поставленной задачи.

Представлены два решения на базе больших языковых моделей: система автоматического извлечения документов и генератор тестовых сценариев, успешно внедренные в реальной компании.

Несмотря на стремительное развитие инструментов автоматизации разработки, многие задачи в области разработки программного обеспечения по-прежнему требуют значительных ручных усилий. В данной работе, ‘Supporting software engineering tasks with agentic AI: Demonstration on document retrieval and test scenario generation’, предлагается подход, основанный на использовании агентного искусственного интеллекта, для решения двух ключевых задач: автоматической генерации тестовых сценариев и интеллектуального поиска по документации. Разработанные решения, продемонстрированные в условиях реальной компании, позволяют повысить эффективность и автоматизировать рутинные процессы разработки. Какие перспективы открывает дальнейшее развитие агентных систем для поддержки полного цикла разработки программного обеспечения и повышения качества конечного продукта?

Автоматизированное тестирование: Когда гибкость важнее скриптов

Традиционное автоматизированное тестирование часто сталкивается с трудностями при работе со сложными сценариями и постоянно меняющимися требованиями к программному обеспечению. Существующие инструменты, основанные на жестких скриптах, требуют значительных усилий для адаптации к новым условиям и поддержания актуальности тестовых случаев. Проблема усугубляется ростом сложности современных программных систем и ускорением циклов разработки. Постоянная потребность в ручной корректировке и обновлении тестов приводит к замедлению процесса выпуска, увеличению затрат и повышению риска ошибок. В связи с этим, возникает необходимость в более гибких и адаптивных решениях, способных самостоятельно реагировать на изменения и эффективно покрывать сложные сценарии тестирования.

Внедрение агентного искусственного интеллекта (ИИ) представляет собой принципиально новый подход к автоматизированному тестированию и обработке документации. Вместо традиционных, жестко запрограммированных скриптов, система использует взаимодействие множества специализированных агентов, каждый из которых отвечает за конкретную задачу — от анализа требований до генерации тестовых случаев и проверки результатов. В рамках реального проекта в крупной SE-компании, данный подход позволил значительно повысить адаптивность автоматизированного тестирования к изменяющимся спецификациям и сложному функционалу. Система способна самостоятельно понимать контекст, выявлять ключевые аспекты требований и формировать эффективные тестовые сценарии, что значительно сокращает время и ресурсы, необходимые для обеспечения качества программного обеспечения.

В отличие от традиционных систем автоматизированного тестирования, опирающихся на жестко заданные сценарии, новый подход использует динамические системы, основанные на принципах рассуждения. Вместо простого выполнения последовательности действий, такие системы способны понимать сложные требования к программному обеспечению и адаптироваться к изменениям в них. Это достигается за счет использования множества специализированных агентов, каждый из которых отвечает за определенный аспект анализа и генерации тестовых случаев. Благодаря этому, система может самостоятельно выявлять неясности в спецификациях, предлагать альтернативные варианты тестирования и даже предвидеть потенциальные ошибки, значительно повышая эффективность и надежность процесса автоматизированного тестирования.

Наша агентивная система для генерации тестов имеет звездную архитектуру, где компоненты-агенты (обозначены иконками 'робота') взаимодействуют в определенной последовательности, обеспечивая возможность обратной связи и потоков ввода-вывода. — Наша агентивная система для генерации тестов имеет звездную архитектуру, где компоненты-агенты (обозначены иконками ‘робота’) взаимодействуют в определенной последовательности, обеспечивая возможность обратной связи и потоков ввода-вывода.

Интеллект в документах: Как агенты справляются с объёмами

Эффективный поиск и извлечение информации из документов является критически важным для современных систем, однако традиционные подходы сталкиваются с ограничениями, обусловленными фиксированным размером контекстного окна языковых моделей и динамичностью документации. Ограниченность контекстного окна препятствует обработке больших документов или наборов документов, в то время как постоянное обновление документации требует механизмов для отслеживания изменений и обеспечения актуальности извлекаемой информации. Для преодоления этих проблем необходимы системы, способные эффективно индексировать и извлекать релевантные фрагменты документов, учитывая как их размер, так и частоту обновлений, что обеспечивает доступ к наиболее точной и полной информации.

Интеграция базы данных Qdrant с агентами, такими как Reading Agent и Trace Agent, позволяет эффективно решать проблему ограниченного контекстного окна и динамически меняющейся документации. Qdrant предоставляет возможности векторного поиска и семантического анализа, что позволяет агентам быстро находить наиболее релевантную информацию в больших объемах документов. Reading Agent использует Qdrant для извлечения конкретных данных из документов, а Trace Agent — для отслеживания изменений и обеспечения актуальности информации, предоставляемой агентам. Такой подход позволяет значительно повысить точность и эффективность обработки документов, обходя ограничения, связанные с фиксированным размером контекстного окна больших языковых моделей.

Интеграция больших языковых моделей (БЯМ), таких как GPT-4 и Mistral, с агентами Delegator Agent и Search Agent, значительно повышает точность доступа к информации в конвейере обработки документов. Delegator Agent отвечает за делегирование задач поиска и анализа конкретным агентам, в то время как Search Agent выполняет поиск релевантных фрагментов в базе знаний. БЯМ используются для понимания запросов, интерпретации результатов поиска и извлечения наиболее релевантных данных. Этот подход позволяет преодолеть ограничения, связанные с контекстным окном, и обеспечивает доступ к информации, точно соответствующей заданному вопросу, даже в больших и динамично изменяющихся документах.

Агент поиска извлек фрагмент из реальной документации по FSD, который был отредактирован с переводом текста на английский язык для удобства читателя.

От спецификации к сценарию: Автоматизация генерации тестов

Процесс генерации тестовых сценариев осуществляется посредством взаимодействия специализированных агентов, таких как агент-писатель тестовых сценариев (Test Scenario Writer Agent) и агент-извлекатель (Retriever Agent). Эти агенты анализируют документ с функциональными требованиями (Functional Specification Document) с целью выявления ключевых сценариев тестирования. Агент-извлекатель отвечает за поиск релевантной информации в документе, а агент-писатель использует полученные данные для формирования конкретных тестовых сценариев, определяющих входные данные, ожидаемые результаты и шаги тестирования. Интеллектуальная обработка документа позволяет агентам автоматически извлекать необходимые сведения и преобразовывать их в структурированные тестовые случаи.

В процессе генерации тестовых сценариев активно применяются методы RAG (Retrieval-Augmented Generation), использующие модели, такие как GPT-3.5 и GPT-4, для обеспечения соответствия с исходной функциональной спецификацией. RAG предполагает извлечение релевантной информации из документации и использование её в качестве контекста при генерации сценариев, что позволяет создавать более точные и обоснованные тесты. Этот подход минимизирует риск генерации сценариев, не соответствующих требованиям, за счет опоры на проверенные данные из исходного документа.

Проверка достоверности генерируемых тестовых сценариев осуществляется агентом Fact Checker Agent, который сопоставляет их с исходной функциональной спецификацией. Для обеспечения совместимости и адаптации к различным форматам используются дополнительные агенты, такие как Translator Agent, осуществляющий перевод и локализацию, и Excel Writer Agent, формирующий данные в табличном виде. Данный процесс позволяет гарантировать соответствие сгенерированных сценариев требованиям спецификации и упрощает их интеграцию в существующие системы тестирования.

Результаты генерации тестовых сценариев, представленные в виде Excel-файла, соответствуют исходному запросу из рис. 2 и входным данным FSD с рис. 3.

Будущее автоматизированного интеллекта: За пределами тестов

Комбинирование фреймворков LangChain и LangGraph позволяет создать мощную платформу для организации работы интеллектуальных агентов, способную решать сложные задачи. LangChain обеспечивает базовые инструменты для взаимодействия с большими языковыми моделями (LLM), в то время как LangGraph добавляет возможность структурирования этих агентов в графы, что позволяет им последовательно выполнять многоэтапные рабочие процессы. Такой подход позволяет не просто запрашивать информацию у LLM, но и автоматизировать сложные процессы, где агенты могут обмениваться данными, координировать свои действия и совместно решать поставленные задачи. В результате, создается гибкая и масштабируемая система, способная адаптироваться к различным сценариям и требованиям, открывая новые возможности для автоматизации и повышения эффективности в различных областях.

Данный подход, изначально продемонстрированный в контексте автоматической генерации тестов, обладает значительно большим потенциалом. Он успешно применим к широкому спектру задач, связанных с обработкой больших объемов документации. В частности, системы, основанные на объединении языковых моделей и графов знаний, эффективно извлекают ключевую информацию из документов, автоматизируя процессы анализа и категоризации. Кроме того, подобная архитектура позволяет осуществлять верификацию соответствия документов нормативным требованиям и стандартам, выявляя несоответствия и обеспечивая соблюдение установленных правил. Возможности автоматизации в этих областях существенно снижают трудозатраты и повышают точность выполнения задач, связанных с документацией.

Постоянное развитие больших языковых моделей, таких как LLaMA, в сочетании с усовершенствованными механизмами извлечения информации, неуклонно повышает точность, эффективность и способность искусственного интеллекта решать всё более сложные задачи. Внедрение двух агентических AI-решений в реальной среде крупной инженерной компании продемонстрировало, что данный подход позволяет не только автоматизировать рутинные процессы, но и качественно улучшить анализ данных, принятие решений и общую производительность. Ожидается, что дальнейшее совершенствование этих технологий позволит создавать интеллектуальные системы, способные к адаптации, обучению и решению задач, ранее доступных только человеку, что открывает новые перспективы для автоматизации и оптимизации в различных отраслях.

В изучении возможностей агентного ИИ для автоматизации задач разработки программного обеспечения, представленном в данной работе, отчетливо прослеживается закономерность, известная каждому, кто долгое время работает в индустрии. Автоматизация, будь то генерация тестовых сценариев или поиск документации, — это лишь отсрочка неизбежного. Как заметил Андрей Колмогоров: «Математика — это искусство говорить правду с максимальной точностью». Но даже самая точная модель, развернутая в реальной среде, столкнется с хаосом продакшена. Автоматизация лишь сдвигает точку отказа, делая ее более предсказуемой, но не устраняя ее. И, как это часто бывает, элегантная теория встречается с суровой реальностью, где любой задеплоеный код однажды упадёт.

Что дальше?

Представленные решения, автоматизирующие поиск документации и генерацию тестовых сценариев, кажутся логичным шагом в погоне за «умным» ПО. Однако, стоит помнить, что каждая новая библиотека — это лишь очередная обёртка над старыми багами, а каждая «революционная» технология завтра станет техдолгом. Автоматизация, конечно, полезна, но не стоит забывать, что именно человек в конечном итоге разбирается в хаосе, созданном автоматизированными системами.

Настоящая проблема не в создании агентов, а в поддержании их работоспособности в реальных условиях. Производство всегда найдёт способ сломать элегантную теорию. Вероятно, следующие шаги лежат в области повышения устойчивости этих систем к «грязным» данным и непредсказуемым запросам. И, конечно, в создании инструментов для отладки самих агентов — потому что когда «умная» система ломается, понять, почему, становится задачей нетривиальной.

В конечном итоге, всё новое — это просто старое с худшей документацией. И пока кто-то изобретает очередного агента, кто-то другой будет писать патчи к его ошибкам. И так по кругу. Возможно, DevOps — это просто смирение с неизбежным.

Оригинал статьи: https://arxiv.org/pdf/2602.04726.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-02-05 08:25

🚀 Квантовые новости