Искусственный интеллект в огне: новый подход к моделированию горения

Автор: Денис Аветисян


Исследователи предлагают комплексную систему для внедрения и оценки знаний в больших языковых моделях, применяемых к сложным задачам в науке о горении.

🚀 Квантовые новости

Подключайся к потоку квантовых мемов, теорий и откровений из параллельной вселенной.
Только сингулярные инсайты — никакой скуки.

Присоединиться к каналу
Предложенная база знаний позволила сформировать целостную картину области науки о горении, выявляя взаимосвязи и структуру ключевых концепций, что позволяет рассматривать эту область как взаимосвязанную систему, а не набор разрозненных фактов и исследований.
Предложенная база знаний позволила сформировать целостную картину области науки о горении, выявляя взаимосвязи и структуру ключевых концепций, что позволяет рассматривать эту область как взаимосвязанную систему, а не набор разрозненных фактов и исследований.

Представлена унифицированная платформа и набор критериев оценки для создания доменно-специфичной базовой модели, демонстрирующая ограничения наивного подхода Retrieval-Augmented Generation (RAG) в обеспечении точности.

Несмотря на стремительное развитие больших языковых моделей (LLM), их применение в специализированных областях науки, таких как горение, требует новых подходов к внедрению и оценке знаний. В работе, озаглавленной ‘A unified foundational framework for knowledge injection and evaluation of Large Language Models in Combustion Science’, представлен комплексный фреймворк, включающий мультимодальную базу знаний объемом 3,5 миллиарда токенов и эталонный набор данных CombustionQA для оценки LLM в области горения. Полученные результаты демонстрируют, что наивные методы генерации с поиском (RAG) имеют существенные ограничения, обусловленные искажениями контекста, и требуют использования структурированных графов знаний и продолженного обучения для создания полноценной научной основы. Каковы перспективы масштабирования подобного подхода для других сложных инженерных дисциплин и создания действительно «умных» систем поддержки принятия решений?


Ограничения знаний в науке о горении

Несмотря на значительный прогресс в области больших языковых моделей, их применение к сложным научным дисциплинам, таким как горение, сталкивается с существенными трудностями, обусловленными недостатком специализированных знаний. Эти модели, обученные на обширных, но часто обобщенных корпусах текстов, испытывают трудности с пониманием и применением узкоспециализированной терминологии, принципов и закономерностей, характерных для данной области. Это приводит к тому, что даже самые передовые модели демонстрируют ограниченные возможности в решении сложных задач, требующих глубокого понимания физико-химических процессов, происходящих при горении, и не способны эффективно оперировать специфическими данными и концепциями, что снижает их практическую ценность для исследователей и инженеров, работающих в этой сфере.

Существующие методы сталкиваются с трудностями при эффективной интеграции огромного и многогранного объема информации, содержащегося в специально созданном массиве данных, включающем 200 тысяч статей, 8 тысяч диссертаций и 400 тысяч строк кода, что в сумме составляет 3.5 миллиарда токенов. Эта сложность препятствует точному рассуждению и анализу в области горения, поскольку алгоритмы испытывают затруднения при обработке и сопоставлении разрозненных фактов, специфических терминов и сложных взаимосвязей, характерных для данной научной дисциплины. Неспособность эффективно использовать этот обширный массив знаний приводит к ограничению возможностей современных систем в решении специализированных задач и поиске ответов на сложные вопросы, связанные с процессами горения.

Несмотря на значительный прогресс в области искусственного интеллекта, применение современных языковых моделей к специализированным областям, таким как горение, сталкивается с серьезными трудностями. Анализ производительности базовой модели без предварительного обучения на специфических данных показывает крайне низкий уровень точности — всего 23.35% при ответе на 436 вопросов из набора данных CombustionQA. Данный результат наглядно демонстрирует существенные пробелы в знаниях, препятствующие эффективному решению узкоспециализированных задач в науке о горении и подчеркивает необходимость разработки методов, позволяющих интегрировать и использовать огромные объемы специализированной информации для повышения точности и надежности получаемых ответов.

Процесс построения набора данных CombustionQA, состоящего из 436 вопросов, включает в себя несколько этапов.
Процесс построения набора данных CombustionQA, состоящий из 436 вопросов, включает в себя несколько этапов.

Фреймворк инжекции знаний: систематический подход

Предлагаемый Фреймворк Инжекции Знаний представляет собой систематизированный подход к созданию надежной базовой модели для науки о горении. Он обеспечивает структурированный процесс, включающий сбор, обработку и интеграцию знаний из различных источников, что позволяет создавать модели, способные эффективно решать сложные задачи в данной области. В отличие от традиционных методов, этот фреймворк ориентирован на последовательное наращивание знаний и повышение производительности модели за счет использования как теоретических данных, так и результатов экспериментов, что обеспечивает ее адаптивность и масштабируемость.

В основе фреймворка лежит создание AI-Ready Базы Знаний, представляющей собой структурированный источник информации для обучения моделей в области горения. База данных формируется из двух основных типов источников: рецензируемых научных публикаций и экспериментальных данных. Использование обоих типов данных обеспечивает полноту и достоверность информации, необходимой для создания надежной фундаментальной модели. Структурирование данных позволяет эффективно извлекать релевантные знания для последующего использования в процессах обучения и генерации ответов.

В рамках предложенной структуры, технология Retrieval-Augmented Generation (RAG) используется для повышения способности модели отвечать на сложные вопросы. RAG предполагает поиск релевантной информации из сформированной базы знаний и её последующее добавление к входным данным модели перед генерацией ответа. Этот процесс позволяет модели не только опираться на собственные внутренние знания, но и учитывать актуальную информацию из внешних источников, обеспечивая более точные, обоснованные и контекстуально-релевантные ответы на запросы, особенно в областях, требующих доступа к специализированным данным и текущим исследованиям.

Финальный этап фреймворка включает в себя дообучение модели в целевой области для полной интеграции полученных знаний и оптимизации производительности. Этот процесс предполагает использование специализированных наборов данных, релевантных для науки о горении, и настройку параметров модели для достижения максимальной точности и эффективности в решении задач, специфичных для данной области. Дообучение позволяет модели не просто извлекать информацию из базы знаний, но и применять ее для генерации более точных и обоснованных ответов на сложные запросы, а также для прогнозирования поведения систем горения с высокой степенью достоверности. Оценка результатов дообучения проводится с использованием метрик, адаптированных для оценки производительности в задачах моделирования и анализа процессов горения.

Предложенная трехэтапная структура внедрения предметных знаний объединяет базу знаний, оценочный бенчмарк и дорожную карту эволюции для валидации результатов.
Предложенная трехэтапная структура внедрения предметных знаний объединяет базу знаний, оценочный бенчмарк и дорожную карту эволюции для валидации результатов.

Оценка и уточнение производительности поиска

В качестве базовой реализации Retrieval-Augmented Generation (RAG) была использована наивная схема, основанная на векторных представлениях (embeddings), сгенерированных моделью BGE-M3. Для обеспечения эффективного поиска по сходству векторов был выбран индекс FAISS. Данный подход предполагает кодирование текстовых фрагментов в векторы, что позволяет находить наиболее релевантные фрагменты на основе векторной близости к запросу пользователя. Использование FAISS позволило оптимизировать скорость поиска среди большого количества векторов, что является критичным для интерактивных приложений.

Оценка производительности системы с использованием эталонного набора данных CombustionQA выявила ограничения в полноте поиска (recall) — всего 43.7%. Это указывает на то, что система часто не способна идентифицировать релевантные сегменты исходных документов. Низкий показатель полноты поиска означает, что значительная часть информации, необходимой для ответа на вопрос, остается необнаруженной в процессе извлечения, что негативно сказывается на общей точности и надежности системы.

В ходе тестирования была выявлена проблема «загрязнения контекста», заключающаяся в резком снижении точности до 21.1% при использовании зашумленных данных для поиска. Этот результат оказался хуже, чем у базовой модели, работающей без предоставления контекста (zero-shot baseline). Проблема проявляется в том, что нерелевантные или вводящие в заблуждение фрагменты, попавшие в контекст, существенно ухудшают способность модели к правильному ответу, даже если среди них присутствует и релевантная информация. Это указывает на чувствительность системы к качеству извлекаемых фрагментов и необходимость фильтрации или ранжирования результатов поиска для минимизации влияния «шума».

При первоначальной оценке Naive RAG была достигнута точность в 58.24%, однако этот показатель существенно ниже теоретического максимума в 87.3%, который может быть достигнут при идеальной подаче релевантных источников. Анализ показал, что при корректном извлечении релевантного сегмента точность составляет 70%, но снижается до 50% в случаях, когда релевантный сегмент не был найден. Это указывает на критическую зависимость точности системы от качества и полноты извлечения релевантной информации из базы знаний.

Полученные результаты оценки производительности RAG-системы выявили существенные ограничения в части извлечения релевантной информации, что подчеркивает необходимость внедрения более сложных стратегий поиска. Низкий показатель полноты (43.7%) указывает на частые случаи пропуска релевантных сегментов, а снижение точности до 21.1% при наличии “зашумленных” данных свидетельствует о чувствительности системы к нерелевантному контексту. Несмотря на достигнутую точность в 58.24%, она значительно ниже теоретически возможной (87.3%), что обусловлено в первую очередь недостаточной эффективностью этапа поиска. Анализ данных показал, что точность работы системы при корректно извлеченных фрагментах достигает 70%, однако при пропуске релевантного сегмента падает до 50%, что подтверждает критическую важность оптимизации стратегий поиска для повышения общей производительности системы.

Результаты показывают, что извлечение релевантного фрагмента источника (Hit) значительно улучшает производительность в сценарии “Optimal RAG” по сравнению с ситуацией, когда релевантный фрагмент не найден (Miss).
Результаты показывают, что извлечение релевантного фрагмента источника (Hit) значительно улучшает производительность в сценарии “Optimal RAG” по сравнению с ситуацией, когда релевантный фрагмент не найден (Miss).

К созданию надежной базовой модели предметной области

Разработанная схема внедрения знаний, систематически преодолевающая ограничения первоначальных методов поиска информации, открывает путь к созданию более надёжной и точной базовой модели для науки о горении. Традиционные подходы часто сталкиваются с трудностями при извлечении релевантных знаний из обширных научных баз данных, что приводит к неточностям и ошибкам в моделировании сложных процессов горения. Данная разработка, напротив, фокусируется на усовершенствовании процесса поиска, позволяя эффективно извлекать и интегрировать специализированные знания в модель. Это достигается за счёт применения новых алгоритмов, оптимизированных для работы со специфической терминологией и сложностью данных в области горения, что значительно повышает достоверность и точность прогнозов, получаемых с помощью модели. Результатом является инструмент, способный более эффективно решать задачи, связанные с проектированием двигателей, оптимизацией топлива и снижением выбросов.

Усовершенствованная модель открывает новые возможности для ускорения исследований в ключевых областях, связанных с двигателестроением, оптимизацией топлив и снижением выбросов. Более точное моделирование процессов горения позволяет инженерам и ученым проводить виртуальные эксперименты, значительно сокращая время и затраты на физические прототипы. В частности, это способствует разработке более эффективных и экологически чистых двигателей внутреннего сгорания, а также поиску инновационных топливных составов, направленных на снижение вредных выбросов в атмосферу. Благодаря улучшенному пониманию сложных химических реакций и физических процессов, модель позволяет оптимизировать параметры горения для достижения максимальной производительности и минимального воздействия на окружающую среду.

Предложенный подход, заключающийся в интеграции специализированных знаний в основу модели, не ограничивается областью горения и обладает значительным потенциалом для применения в других сложных научных дисциплинах. Эффективное использование экспертных знаний позволяет преодолеть ограничения, связанные с недостатком размеченных данных, что особенно актуально для областей, где сбор и аннотация данных затруднены или дорогостоящи. Данная методология может быть успешно адаптирована, например, для разработки моделей в материаловедении, геологии, биохимии и других областях, требующих глубокого понимания предметной области для решения сложных задач и проведения эффективного анализа. В перспективе, это способствует переходу к созданию интеллектуальных систем, способных к более надежному и обоснованному принятию решений в различных научных областях, основываясь не только на статистических закономерностях, но и на фундаментальных принципах и экспертных знаниях.

Данное исследование знаменует собой переход от моделей искусственного интеллекта, требующих огромных объемов данных для обучения, к системам, ориентированным на использование специализированных знаний. Такой подход позволяет не только повысить эффективность научных открытий, сократив потребность в обширных наборах данных, но и значительно увеличить надежность получаемых результатов. Вместо слепого анализа больших объемов информации, модели, основанные на знаниях, способны рассуждать и делать выводы, опираясь на проверенные научные принципы и факты. Это открывает новые возможности для автоматизации научных исследований, ускорения процесса разработки инновационных технологий и повышения точности прогнозов в различных областях науки.

Представленная работа демонстрирует стремление к созданию не просто работающих, но и доказуемо корректных систем искусственного интеллекта в области горения. Как отмечал Марвин Минский: «Лучший способ понять, как работает система — построить её самому». Этот принцип находит отражение в предложенном фреймворке, где авторы не ограничиваются применением готовых моделей, а стремятся к созданию специализированной основы для работы с данными в области горения. Особое внимание уделяется выявлению ограничений наивного подхода RAG, в частности, проблемам, связанным с неточным извлечением информации и загрязнением контекста, что подчеркивает необходимость математической чистоты и точности алгоритмов.

Куда двигаться дальше?

Представленная работа, несмотря на свою кажущуюся завершённость, лишь подчёркивает фундаментальную сложность задачи внедрения знаний в большие языковые модели. Простое добавление информации, даже в структурированном виде, не гарантирует её корректного использования. Наивный подход к поиску и извлечению информации (RAG) страдает от неизбежных ошибок — неудачного поиска и “загрязнения” контекста. Это не ошибка реализации, а закономерное следствие неспособности текущих моделей к истинному пониманию.

Будущие исследования должны сосредоточиться не на увеличении объёма данных, а на разработке алгоритмов, способных к верификации и отсеиванию нерелевантной или противоречивой информации. Необходимо отойти от концепции “чёрного ящика” и стремиться к созданию моделей, для которых процесс принятия решений будет доказуем, а не просто эмпирически подтверждён. Иначе говоря, задача не в том, чтобы модель “работала” на тестовых примерах, а в том, чтобы она решала задачу математически корректно.

Перспективным направлением представляется разработка гибридных систем, сочетающих в себе преимущества больших языковых моделей и традиционных экспертных систем. Такой подход позволит не только извлекать знания из текста, но и формализовывать их в виде логических правил, что повысит надёжность и предсказуемость работы модели. В конечном итоге, элегантность решения заключается не в его краткости, а в его непротиворечивости и логической завершённости.


Оригинал статьи: https://arxiv.org/pdf/2603.04452.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-03-07 23:55