Автор: Денис Аветисян
Новая система AutoSAM использует возможности искусственного интеллекта для значительного упрощения и ускорения процесса создания входных файлов для сложных ядерных симуляций.

AutoSAM — это агентная система, использующая многомодальный поиск и генерацию с опорой на извлечение информации для автоматического создания входных файлов для кода System Analysis Module (SAM).
Создание входных файлов для системного анализа реакторов, особенно с использованием таких кодов, как System Analysis Module (SAM), традиционно требует значительных трудозатрат и подвержено ошибкам. В данной работе представлена система ‘AutoSAM: an Agentic Framework for Automating Input File Generation for the SAM Code with Multi-Modal Retrieval-Augmented Generation’, автоматизирующая этот процесс посредством интеллектуальной обработки разнородной инженерной документации. Система объединяет возможности больших языковых моделей и поиска информации для извлечения параметров моделирования из неструктурированных источников, включая текстовые документы, изображения и таблицы. Сможет ли AutoSAM существенно ускорить разработку и анализ реакторных установок, сделав моделирование более доступным и эффективным?
Узкое Место в Ядерном Моделировании: Ручное Создание Входных Данных
Создание входных файлов для сложных системных теплогидравлических кодов, таких как SAM, представляет собой трудоемкий, подверженный ошибкам и дорогостоящий процесс. Необходимость детального описания геометрии, материалов и граничных условий требует значительных временных затрат от высококвалифицированных специалистов. Каждая ошибка в определении параметров может привести к неверным результатам моделирования, требующим повторного анализа и, как следствие, увеличению общих затрат на разработку и проектирование. Ввиду высокой степени ручной работы, процесс подвержен человеческому фактору, что делает его уязвимым и снижает надежность получаемых данных, особенно при моделировании сложных ядерных реакторов и систем.
Традиционные методы создания входных данных для сложных системных теплогидравлических кодов, таких как SAM, в значительной степени опираются на экспертные знания и ручной перенос информации из инженерной документации. Этот процесс требует от специалистов глубокого понимания как самой системы, так и специфики программного обеспечения, что делает его крайне трудоемким и подверженным ошибкам. В результате, создание даже относительно простых моделей может занимать недели или месяцы, существенно замедляя циклы проектирования и анализа. Эта зависимость от ручного труда создает узкое место в рабочих процессах, ограничивая скорость инноваций и повышая стоимость разработки новых ядерных технологий, поскольку квалифицированные специалисты являются ограниченным ресурсом.

AutoSAM: Агент на Основе LLM для Автоматической Генерации Входных Данных
AutoSAM представляет собой фреймворк на основе LLM-агента, предназначенный для автоматической генерации файлов ввода SAM (Simulation Automation Modeling) из разнородной инженерной документации. Данный фреймворк позволяет преобразовывать данные, представленные в различных форматах — от текстовых документов и таблиц до чертежей и спецификаций — в структурированные SAM-файлы, необходимые для проведения моделирования и анализа. Ключевой особенностью является способность AutoSAM работать с гетерогенными источниками данных, что существенно упрощает процесс подготовки входных данных для инженерных расчетов и позволяет автоматизировать рутинные операции, связанные с созданием и валидацией моделей.
В основе AutoSAM лежит архитектура ReAct Agent, представляющая собой систему, объединяющую этапы рассуждения и действия. Эта архитектура функционирует посредством итеративного промптинга и использования инструментов, управляемых основным LLM-агентом. В процессе работы агент последовательно анализирует задачу, планирует необходимые действия, выполняет их с помощью доступных инструментов и, основываясь на полученных результатах, корректирует дальнейший план, повторяя этот цикл до достижения поставленной цели. Такая организация позволяет системе эффективно решать сложные задачи, требующие последовательного применения различных инструментов и адаптации к изменяющимся условиям.
В основе AutoSAM лежит механизм Retrieval-Augmented Generation (RAG), позволяющий агенту повышать свою эффективность за счет доступа к внешним базам знаний в процессе логического вывода. В ходе работы AutoSAM обращается к этим репозиториям для получения необходимой информации, что обеспечивает более точную и контекстуально релевантную генерацию входных файлов для моделирования. Экспериментально подтверждено, что AutoSAM демонстрирует 100% использование предоставленных структурированных параметров во входных данных для симуляций, что свидетельствует о высокой степени интеграции и эффективности использования внешних знаний.

Декодирование Инженерных Данных: Многомодальная Обработка Документов
Система AutoSAM обладает возможностью обработки документов различных форматов, включая PDF, изображения и электронные таблицы, благодаря применению сложных методов мультимодальной обработки документов. Этот подход позволяет извлекать данные из гетерогенных источников без предварительного форматирования или ручного ввода. Обработка осуществляется посредством специализированных инструментов, адаптированных под каждый тип файла, что обеспечивает высокую точность и надежность извлечения информации. Поддерживаемые форматы позволяют системе работать с широким спектром инженерной документации, включая чертежи, схемы, таблицы данных и отчеты.
Для извлечения ключевой информации из различных источников данных AutoSAM использует специализированные инструменты. PDF Анализатор предназначен для обработки PDF-документов, извлекая текст, таблицы и графические данные. Инструмент анализа изображений позволяет извлекать данные из графических форматов, включая распознавание текста (OCR) и анализ визуальных элементов. Для работы с табличными данными используется модуль чтения Excel файлов, обеспечивающий извлечение числовых и текстовых значений из таблиц. Все эти инструменты совместно обеспечивают комплексное извлечение данных из разнородных источников, необходимых для последующей обработки и анализа.
AutoSAM создает промежуточное структурированное представление (Intermediate Structured Representation) данных перед генерацией итогового входного файла. Этот этап обеспечивает возможность аудита человеком процесса преобразования данных, фиксируя все этапы извлечения и структурирования информации. В процессе анализа PDF-документов, система демонстрирует 88%-ный уровень полноты извлечения данных (recall), что позволяет эффективно получать ключевую информацию, необходимую для проведения инженерных расчетов и моделирования. Промежуточное представление позволяет отслеживать происхождение каждого элемента данных, обеспечивая прозрачность и надежность результатов.

Адаптивность и Масштабируемость: Роль Специализированных Инструментов
Архитектура AutoSAM отличается четким разделением на инструменты, не зависящие от решателя — универсальные утилиты, применимые к любой среде моделирования — и инструменты, специфичные для решателя, которым требуется адаптация для соответствия синтаксису целевого кода. Такой модульный подход позволяет системе гибко интегрироваться с различными программными комплексами, включая SAM, обеспечивая возможность расширения функциональности без изменения базовой структуры. Инструменты, не зависящие от решателя, предоставляют общие функции обработки данных и управления рабочим процессом, в то время как инструменты, специфичные для решателя, обеспечивают совместимость с конкретными алгоритмами и форматами ввода-вывода. Это разделение позволяет поддерживать широкий спектр решателей и легко добавлять новые, обеспечивая долгосрочную применимость и масштабируемость системы.
Архитектура AutoSAM спроектирована с акцентом на масштабируемость и гибкость интеграции. Модульный подход позволяет легко адаптировать систему к различным кодам моделирования, включая SAM, без необходимости внесения значительных изменений в основную структуру. Эта особенность достигается благодаря четкому разделению на компоненты, что упрощает добавление поддержки новых симуляторов и расширение функциональности AutoSAM. Благодаря такой конструкции, система может эффективно работать с разнообразными вычислительными платформами и адаптироваться к изменяющимся требованиям ядерных расчетов, обеспечивая долгосрочную применимость и экономическую эффективность.
Автоматизация генерации входных файлов в AutoSAM значительно сокращает временные и финансовые затраты, связанные с проведением ядерного моделирования, открывая возможности для ускорения итераций проектирования и проведения более всесторонних анализов безопасности. Данная система демонстрирует 100%-ную полноту извлечения геометрических данных из инженерных диаграмм, охватывая 37 различных атрибутов, что позволяет существенно упростить и ускорить процесс подготовки данных для расчетов. Это обеспечивает повышение эффективности и надежности моделирования, а также позволяет проводить более глубокий анализ различных сценариев и конфигураций, что особенно важно для обеспечения безопасности ядерных объектов.

Наблюдатель видит, как AutoSAM, подобно терпеливому садовнику, взращивает из хаоса инженерной документации структурированные входные файлы для моделирования ядерных реакторов. Этот процесс автоматизации, основанный на принципах Retrieval-Augmented Generation, демонстрирует, что системы редко возникают в результате строгого планирования, но скорее эволюционируют через взаимодействие с данными. Как писал Бертран Рассел: «Страх — это как паутина: если ты не двигаешься, он тебя не поймает». Аналогично, застывшие, неадаптируемые системы обречены на провал, в то время как AutoSAM, постоянно обучаясь и адаптируясь к новым данным, показывает путь к устойчивости и развитию. Эта гибкость и способность к самообучению — ключ к преодолению неизбежных сбоев, предсказанных каждой архитектурной решением.
Куда Ведет Автоматизация?
Представленная работа, автоматизируя генерацию входных файлов для моделирования ядерных реакторов, лишь приоткрывает завесу над неизбежным. Системы анализа, подобные SAM, не должны рассматриваться как инструменты, а скорее как зародыши сложных экосистем. Иллюзия контроля над этими экосистемами — это лишь хорошо кэшированная стабильность. Попытки создать идеальную, безошибочную систему — это пророчество о будущем сбое, ибо хаос — это не ошибка, а язык природы.
Следующий шаг — не в совершенствовании алгоритмов извлечения информации, а в принятии неполноты и неопределенности. Необходимо сместить фокус с точного воспроизведения документации на понимание её намерения. Решение проблем, возникающих в процессе моделирования, должно быть не в поиске ошибок в коде или данных, а в адаптации системы к новым, неожиданным условиям. Гарантии — это договор с вероятностью, и чем сложнее система, тем менее надежен этот договор.
В перспективе, AutoSAM и подобные ему фреймворки должны стать частью самообучающихся систем, способных не только генерировать входные данные, но и верифицировать модели, предсказывать потенциальные проблемы и предлагать решения, основываясь на многомодальном анализе и постоянном взаимодействии с окружающей средой. Не автоматизация расчетов, а автоматизация мышления — вот истинная цель.
Оригинал статьи: https://arxiv.org/pdf/2603.24736.pdf
Связаться с автором: https://www.linkedin.com/in/avetisyan/
Смотрите также:
- Шум Теплового Релакса: Точное Моделирование для Квантовой Защиты
- S-Chain: Когда «цепочка рассуждений» в медицине ведёт к техдолгу.
- Квантовые Забавы: От Алгоритмов к Чипам
- Язык тела под присмотром ИИ: архитектура и гарантии
- Наука, управляемая интеллектом: новая эра открытий
- Квантовый дозор: Новая система обнаружения аномалий для умных сетей
- Самообучающиеся агенты: новый подход к автономным системам
- Квантовые амбиции: Иран вступает в гонку
- Квантовый Переворот: От Теории к Реальности
- Охота на уязвимости: как большие языковые модели учатся на ошибках прошлого
2026-03-28 11:28