Автор: Денис Аветисян
Новая система GraphAgents использует возможности многоагентного ИИ и графов знаний для ускорения разработки экологичных материалов.

GraphAgents — это многоагентный фреймворк, использующий графы знаний для генерации гипотез при проектировании материалов, в частности, в поиске устойчивых альтернатив ПФУ.
Несмотря на экспоненциальный рост объемов научных данных, установление взаимосвязей между различными областями знаний остается сложной задачей. В данной работе, посвященной разработке системы ‘GraphAgents: Knowledge Graph-Guided Agentic AI for Cross-Domain Materials Design’, представлен многоагентный подход, использующий знания, структурированные в графах, для генерации гипотез в материаловедении. Предложенная архитектура позволяет эффективно находить устойчивые альтернативы пер- и полифторалкильным веществам (PFAS), преодолевая ограничения как отдельных языковых моделей, так и традиционных методов поиска. Способна ли такая система значительно ускорить процесс создания новых, экологически безопасных материалов с заданными свойствами, расширяя горизонты инноваций в данной области?
Трудности материаловедческого поиска: почему инновации буксуют
Традиционный подход к разработке материалов характеризуется значительной трудоемкостью и высокими финансовыми затратами. Процесс зачастую сводится к последовательному синтезу и тестированию различных составов, что представляет собой длительный цикл проб и ошибок. Такая эмпирическая методология существенно замедляет инновации, поскольку требует значительных временных и ресурсных вложений для получения новых материалов с заданными свойствами. Отсутствие систематического подхода и глубокого понимания взаимосвязей между составом, структурой и свойствами материалов приводит к неэффективному использованию потенциала материаловедения и препятствует быстрому внедрению передовых технологий. В результате, разработка новых материалов, необходимых для решения актуальных задач в различных областях науки и техники, значительно затягивается.
Огромное разнообразие возможных материалов представляет собой колоссальную проблему для современной науки и техники. Исследование каждого соединения традиционными методами требует значительных временных и финансовых затрат, что делает процесс открытия новых материалов чрезвычайно медленным. В связи с этим, всё большее значение приобретают вычислительные методы, позволяющие значительно ускорить поиск перспективных материалов. Компьютерное моделирование и анализ данных позволяют исследователям просматривать огромные «материальные пространства», предсказывая свойства соединений до их фактического синтеза, тем самым существенно сокращая цикл разработки и открывая путь к инновационным технологиям. Этот переход от эмпирического подхода к вычислительному моделированию является ключевым фактором в решении задачи создания материалов с заданными характеристиками для широкого спектра применений.
Существующие вычислительные методы в области материаловедения зачастую сталкиваются с ограничениями в способности улавливать сложные взаимосвязи между структурой и свойствами материалов. Традиционные алгоритмы, основанные на статистическом анализе и машинном обучении, могут успешно предсказывать свойства для материалов, похожих на те, что уже известны, но испытывают трудности при экстраполяции на принципиально новые составы или структуры. Это связано с тем, что они оперируют преимущественно с корреляциями, а не с фундаментальными физическими принципами, определяющими поведение материала. В результате, поиск инновационных материалов с заданными характеристиками требует значительных вычислительных ресурсов и часто приводит к неэффективному исследованию огромного пространства возможностей. Разработка методов, способных к логическому выводу и построению причинно-следственных связей, является ключевой задачей для ускорения процесса открытия новых материалов и преодоления ограничений существующих подходов.

Графы знаний: новый подход к материаловедению
Графы знаний предоставляют структурированное представление свойств материалов и взаимосвязей между ними, что позволяет эффективно осуществлять логические выводы. В этих графах узлы представляют собой материалы, свойства, процессы или концепции, а ребра — отношения между ними, такие как «обладает свойством», «является частью», или «влияет на». Структурирование данных в виде графа позволяет использовать алгоритмы обхода графа и логического вывода для автоматического выявления скрытых связей, прогнозирования свойств материалов и генерации новых гипотез. Например, можно определить материалы, обладающие определенным набором характеристик, или предсказать, как изменение одного свойства повлияет на другие. Такой подход обеспечивает более эффективный анализ и обработку данных по сравнению с традиционными методами, основанными на реляционных базах данных или неструктурированном тексте.
Многоагентные системы искусственного интеллекта (ИИ) предоставляют эффективный подход к решению сложных задач материаловедения, разбивая их на ряд более простых, независимо решаемых подзадач. Каждый агент в такой системе специализируется на конкретном аспекте проблемы, например, на поиске данных о конкретном свойстве материала, моделировании определенного физического явления или оптимизации параметров процесса. Взаимодействие между агентами осуществляется посредством обмена информацией и координации действий, что позволяет комплексно анализировать задачи, требующие учета множества взаимосвязанных факторов. Такой подход позволяет масштабировать решение сложных проблем, поскольку отдельные агенты могут разрабатываться и оптимизироваться независимо, а также облегчает параллельную обработку данных, что значительно сокращает время, необходимое для получения результатов.
Комбинирование поиска информации, основанного на доказательствах, с контролируемым обходом графа знаний позволяет существенно ускорить генерацию гипотез и открытие новых материалов. Данный подход предполагает извлечение релевантных данных из структурированного графа знаний на основе конкретных запросов или критериев, а затем использование контролируемых алгоритмов обхода графа для выявления связей и закономерностей между материалами и их свойствами. В результате, исследователь может быстро формировать и проверять гипотезы о взаимосвязи между составом, структурой и свойствами материалов, что существенно сокращает время и ресурсы, необходимые для открытия новых материалов с заданными характеристиками. Алгоритмы контролируемого обхода позволяют целенаправленно исследовать определенные участки графа, фокусируясь на наиболее перспективных направлениях поиска.

Архитектура Graph Agents: разделяй и властвуй в материаловедении
Архитектура Graph Agents предполагает использование специализированных агентов — Планировщика, Оценщика и Инженера — для организации процесса разработки. Планировщик отвечает за определение последовательности действий, необходимых для достижения поставленной цели. Оценщик анализирует промежуточные результаты и оценивает их соответствие заданным критериям, предоставляя обратную связь для корректировки стратегии. Инженер осуществляет непосредственную реализацию разработанного плана, используя доступные ресурсы и инструменты. Взаимодействие между этими агентами осуществляется посредством четко определенных интерфейсов, обеспечивая слаженную работу и оптимизацию всего процесса проектирования.
Гибридный агент GraphWeave обеспечивает комплексный доступ к информации благодаря бесшовной интеграции неструктурированного текста и структурированных знаний. Этот агент использует как необработанные текстовые данные, полученные из различных источников, так и структурированные данные, представленные в виде графа знаний. Интеграция позволяет агенту осуществлять поиск и анализ информации, используя преимущества обоих форматов — гибкость текстовых данных и точность структурированных знаний. Это обеспечивает более полное и контекстуально-обогащенное понимание предметной области, чем при использовании только одного типа данных.
Агент Creative GraphWeave использует алгоритмы поиска путей — поиск в ширину (Breadth-First Search), поиск в глубину (Depth-First Search), поиск кратчайшего простого пути (Shortest Simple Path) и Top-N кратчайших простых путей — для исследования новых связей между материалами. Процесс поиска направляется семантическими остановками (Semantic Stops), которые определяют критерии для прекращения или изменения направления поиска, что позволяет агенту эффективно исследовать пространство возможных материальных комбинаций и находить нетривиальные соединения.
В качестве языковой основы для всех агентов используется большая языковая модель LLama-3. Для обеспечения непрерывной адаптации и обучения системы применяется метод X-LoRA (Low-Rank Adaptation). X-LoRA позволяет эффективно настраивать LLama-3 на специфические задачи и данные, минимизируя вычислительные затраты и объем необходимых параметров для обучения по сравнению с полной перенастройкой модели. Это обеспечивает возможность оперативного обновления знаний и улучшения производительности агентов в процессе эксплуатации, а также интеграции новой информации без существенного влияния на базовую языковую модель.
Специализированный граф знаний, посвященный пер- и полифторалкильным веществам (ПФАС), состоит из 4716 статей. Данный граф был сформирован из исходного набора результатов, насчитывавшего 4824 статьи, с общим коэффициентом извлечения (yield) приблизительно 97.8%. Высокий показатель извлечения указывает на эффективность процесса фильтрации и отбора релевантных материалов для формирования графа знаний по данной тематике.
База знаний о свойствах материалов содержит 63 222 аннотаций, полученных в результате обработки общего объема в 160 495 аннотаций. Этот объем данных представляет собой основу для анализа и поиска взаимосвязей между различными материалами и их характеристиками, обеспечивая информационную поддержку для разработки новых материалов и оптимизации существующих.
В процессе построения графов знаний применялся порог косинусного сходства, равный 0.95, для идентификации и объединения семантически схожих узлов. Данный метод позволял эффективно устранять дублирование информации и формировать более компактное и информативное представление знаний. Использование косинусного сходства в качестве метрики позволило количественно оценить семантическую близость узлов, основываясь на векторном представлении их характеристик. Превышение установленного порога в 0.95 служило критерием для объединения узлов, что способствовало повышению согласованности и точности графа знаний.
Результаты проведенных исследований по исключению отдельных компонентов (ablation studies) показали, что полная многоагентная архитектура последовательно превосходит все конфигурации, в которых исключены отдельные агенты или их комбинации. Это подтверждает критическую роль каждого компонента — Planner, Evaluator, Engineer, а также агентов GraphWeave — в эффективном функционировании системы. Наблюдаемое снижение производительности при исключении любого из агентов указывает на их взаимозависимость и необходимость совместной работы для достижения оптимальных результатов в процессе проектирования материалов.

Преодолевая ограничения: от ПФАС к материалам будущего
В основе разработки устойчивых альтернатив опасным перфторалкильным и полифторалкильным веществам (ПФАС) лежит создание специализированных графов знаний. Эти графы аккумулируют структурированную информацию о химических соединениях, их свойствах, токсичности и потенциальных заменах. Используя взаимосвязи, зафиксированные в графе знаний, система способна рационально проектировать новые материалы, обладающие требуемыми характеристиками и минимальным воздействием на окружающую среду. Такой подход позволяет целенаправленно искать соединения, которые не только функционально эквивалентны ПФАС, но и лишены их негативных свойств, что значительно ускоряет процесс открытия и внедрения безопасных альтернатив. В отличие от традиционных методов, основанных на проб и ошибок, данный подход позволяет прогнозировать свойства материалов на основе существующих знаний, сокращая время и затраты на исследования.
Система отличается высокой адаптивностью благодаря своей модульной структуре. Это позволяет легко применять её не только для поиска замен перфторалкильным и полифторалкильным веществам (ПФАС), но и для решения широкого спектра задач в области материаловедения. Модульность подразумевает возможность замены или добавления отдельных компонентов — например, алгоритмов поиска или баз данных свойств материалов — без необходимости переработки всей системы. Такая гибкость существенно сокращает время и затраты на адаптацию к новым материалам, специфическим требованиям к производительности или новым вызовам в области экологически безопасного дизайна. Таким образом, разработанный подход представляет собой универсальную платформу для рационального проектирования материалов с заданными свойствами и минимизацией негативного воздействия на окружающую среду.
Сочетание структурированных знаний, интеллектуальных агентов и эффективного обхода графов значительно ускоряет и удешевляет процесс открытия новых материалов. Традиционно, поиск альтернативных веществ требовал длительных и дорогостоящих экспериментов, основанных на методе проб и ошибок. Однако, данный подход позволяет систематизировать информацию о химических соединениях, их свойствах и потенциальных применениях, создавая своего рода “цифровую лабораторию”. Интеллектуальные агенты, используя эти структурированные данные, способны прогнозировать свойства новых материалов и направлять поиск, а эффективный обход графов — быстро выявлять взаимосвязи и оптимальные решения. В результате, время и затраты на разработку материалов сокращаются в разы, открывая возможности для более быстрого внедрения инноваций и решения актуальных экологических проблем.
Данная методология открывает перспективные возможности для создания материалов с улучшенными характеристиками, сниженным воздействием на окружающую среду и повышенной долговечностью. Она позволяет целенаправленно разрабатывать вещества, обладающие не только необходимыми функциональными свойствами, но и минимальным экологическим следом на протяжении всего жизненного цикла — от производства до утилизации. Подход обеспечивает возможность проектирования материалов, способных выдерживать более длительные нагрузки и сохранять свои качества на протяжении продолжительного времени, что способствует сокращению потребления ресурсов и снижению образования отходов. Это, в свою очередь, ведет к повышению устойчивости и эффективности различных отраслей промышленности и способствует созданию более экологичного и безопасного будущего.

Изучение предложенного подхода GraphAgents неизбежно наводит на мысль о вечной борьбе между теорией и практикой. Система, стремящаяся к генерации гипотез для дизайна материалов, опираясь на графы знаний, выглядит элегантно… пока не столкнётся с реальностью. Ведь, как известно, «простота — критерий истины», но в контексте разработки материалов, особенно в поиске устойчивых альтернатив ПФАС, эта истина часто оказывается приукрашенной. Система может сгенерировать тысячи гипотез, но лишь единицы окажутся практически реализуемыми. Этот подход, безусловно, интересен, но он лишь добавляет ещё один слой абстракции к и без того сложному процессу. В конце концов, это всего лишь ещё один инструмент в руках инженера, который, как известно, всегда найдёт способ сломать даже самую изящную теорию. Как говорил Эдсгер Дейкстра: «Я думаю, что я обладаю отличным вкусом, и я не думаю, что мои программы — это уродливые вещи. И все же, я могу сказать вам, что они содержат ошибки».
Что дальше?
Представленная работа, безусловно, элегантна в своей сложности. Многоагентные системы, привязанные к графам знаний — звучит как решение всех проблем материаловедения. Однако, за красивой архитектурой всегда скрывается неизбежная реальность: масштабируемость. Что произойдет, когда этот граф знаний вырастет до размеров, сравнимых с реальными потребностями индустрии? Не превратится ли он в неподдерживаемую, медленно ползущую конструкцию, где каждый новый агент конфликтует со старыми правилами?
Особенно циничным кажется акцент на устойчивых материалах. Как будто сама идея “устойчивости” не станет очередным слоем абстракции, скрывающим компромиссы между стоимостью, производительностью и реальным воздействием на окружающую среду. В конечном счете, всё сводится к тому, что “зеленый” материал просто дешевле утилизировать, когда он устареет. Агентные системы, конечно, могут генерировать гипотезы, но кто-то все равно должен будет провести реальные эксперименты и признать, что большинство из них окажутся неработоспособными.
Вполне вероятно, что через несколько лет, когда первые энтузиасты столкнутся с первыми серьёзными проблемами, они вспомнят о простоте и надежности старых, монолитных подходов. Иногда лучше иметь одну, хорошо протестированную модель, чем сотню микросервисов, каждый из которых выдает немного отличающийся, но одинаково неверный ответ.
Оригинал статьи: https://arxiv.org/pdf/2602.07491.pdf
Связаться с автором: https://www.linkedin.com/in/avetisyan/
Смотрите также:
- Квантовая суперпозиция: новая интерпретация вероятности
- Ускорение генеративных моделей: новый подход к вычислению матричной экспоненты
- Эффективный параллелизм: iCIPT2 на службе квантифицируемой химии
- Ускорение вычислений: Монте-Карло и линейные системы
- Квантовый скачок: от лаборатории к рынку
- Тензорные сети и комбинаторные поиски: новый подход к сложным задачам
- Квантовая геометрия управления: плавные траектории в пространстве состояний
- Адаптация моделей к новым данным: квантильная коррекция для нейросетей
2026-02-10 19:39