Искусственный интеллект на службе химии: создание новых неорганических соединений

Автор: Денис Аветисян

В обзоре рассматривается стремительное развитие методов генеративного искусственного интеллекта для проектирования и открытия неорганических соединений с заданными свойствами.

За прошедшие годы развитие генеративных методов искусственного интеллекта, включающее генетические алгоритмы, генеративно-состязательные сети, вариационные автоэнкодеры, диффузионные модели и большие языковые модели, нашло применение в проектировании неорганических соединений, таких как комплексы переходных металлов, не пористые кристаллы, металлоорганические каркасы и цеолиты.

Обзор посвящен применению генеративных моделей, включая диффузионные модели и вариационные автокодировщики, для предсказания кристаллической структуры и открытия новых материалов.

Несмотря на революционный прорыв машинного обучения в химии, особенно в органической, применение генеративных моделей искусственного интеллекта к неорганическим соединениям сталкивается со значительными трудностями. Данный обзор, посвященный теме ‘Inverse Design of Inorganic Compounds with Generative AI‘, анализирует эволюцию подходов, позволяющих преодолеть эти ограничения и использовать генеративный ИИ — включая диффузионные модели и вариационные автоэнкодеры — для разработки новых неорганических материалов с заданными свойствами. В частности, рассмотрены решения, учитывающие сложность представления химического состава, геометрии и электронной структуры неорганических соединений, от молекул до кристаллических структур, включая металлоорганические каркасы. Какие стандарты бенчмаркинга и метрики синтезируемости необходимы для дальнейшего ускорения открытия и разработки инновационных неорганических материалов с помощью генеративного ИИ?

Основы координационной химии и ретикулярных структур

Координационная химия, заложенная Альфредом Вернером в 1893 году, представляет собой краеугольный камень понимания строения и свойств комплексов переходных металлов. Именно эта дисциплина впервые систематизировала представления о связях между ионами металлов и лигандами — молекулами или ионами, окружающими центральный атом. Вернер, исследуя соединения кобальта и аммиака, доказал, что атомы лигандов располагаются вокруг иона металла в определенной пространственной конфигурации, определяющей свойства комплекса, включая его цвет, магнитные характеристики и реакционную способность. Принципы, сформулированные в координационной химии, такие как теория кристаллического поля и молекулярно-орбитальная теория, позволяют предсказывать и объяснять поведение этих соединений, что, в свою очередь, стало основой для развития множества других областей химии, включая супрамолекулярную химию и материаловедение. Изучение координационных соединений открыло путь к пониманию важнейших биологических процессов, в которых металлы играют ключевую роль, например, в работе ферментов и транспорте кислорода.

Ретикулярная химия развивает основополагающие принципы координационной химии, предлагая подход, основанный на сборке из строительных блоков, для создания протяженных каркасных структур, таких как металлоорганические каркасы (MOF) и цеолиты. Вместо рассмотрения отдельных молекул, ретикулярная химия фокусируется на соединении металлических узлов с органическими линкерами, формируя периодические, пористые структуры. Этот подход позволяет предсказуемо конструировать материалы с заданными свойствами, контролируя размер пор, форму и функциональность каркаса. Благодаря этой возможности, ретикулярная химия предоставляет мощный инструмент для создания материалов с уникальными характеристиками, находящими применение в различных областях, включая катализ, разделение газов и хранение энергии.

Пористые структуры, такие как металлоорганические каркасы (MOF) и цеолиты, представляют собой уникальные материалы, открывающие широкие перспективы в области катализа и разделения веществ. Их способность избирательно адсорбировать молекулы, основанная на размере и форме пор, позволяет создавать высокоэффективные катализаторы и сорбенты. Однако, несмотря на огромный потенциал, рациональное проектирование этих материалов остается сложной задачей. Точное предсказание структуры и свойств MOF, необходимых для конкретного применения, требует глубокого понимания взаимодействия между металлами и органическими линкерами, а также учета влияния внешних факторов, таких как температура и давление. Разработка методов, позволяющих контролировать размер пор, их форму и химический состав, является ключевым направлением современных исследований в области ретикулярной химии и позволит создавать материалы с заданными характеристиками для решения широкого круга практических задач.

Обзор охватывает неорганические соединения, включающие координационные комплексы переходных металлов, компактные неорганические кристаллы и микропористые материалы, такие как металлоорганические каркасы (MOFs) и цеолиты, построенные на основе металлических узлов и линкеров или алюмосиликатных строительных блоков, где металлические узлы в MOFs могут состоять и из отдельных катионов.

Генеративный ИИ: Новый подход к дизайну материалов

Генеративный искусственный интеллект (ИИ) предоставляет мощный подход к обратному проектированию, позволяя создавать новые соединения — включая металлоорганические каркасы (MOF), цеолиты, неорганические кристаллы и так называемые TMC (Time-dependent Metal-organic frameworks) — на основе заданных целевых свойств. В отличие от традиционных методов, основанных на последовательных итерациях синтеза и тестирования, генеративный ИИ способен прогнозировать структуры соединений, которые с высокой вероятностью будут обладать требуемыми характеристиками, такими как определенная пористость, механическая прочность или оптические свойства. Этот подход позволяет существенно расширить пространство поиска новых материалов и ускорить процесс открытия соединений с заданными функциональными возможностями, избегая дорогостоящих и трудоемких экспериментов.

Традиционные методы разработки материалов характеризуются итеративным процессом проб и ошибок, требующим значительных временных и ресурсных затрат. В отличие от этого, генеративный искусственный интеллект (ИИ) позволяет обходить этот трудоемкий подход, осуществляя одновременное исследование обширных химических пространств. Благодаря алгоритмам машинного обучения, ИИ способен генерировать множество потенциальных материалов, предсказывая их свойства и отбирая наиболее перспективные кандидаты для дальнейшей проверки. Это существенно ускоряет процесс открытия новых материалов, сокращая время от идеи до реализации и позволяя исследовать соединения, которые могли бы остаться незамеченными при использовании традиционных методов.

Эффективность генеративного искусственного интеллекта (ИИ) в материаловедении напрямую зависит от надежных метрик оценки. Для обеспечения практической ценности сгенерированных соединений, недостаточно просто достичь новизны структуры. Необходимо оценивать термодинамическую и кинетическую стабильность предложенных материалов, а также их технологическую реализуемость — возможность синтеза с использованием доступных методов и реагентов. Метрики должны учитывать такие параметры, как энергия образования кристаллической решетки, предсказуемость фазовых переходов и соответствие критериям синтезируемости, чтобы отсеять нереалистичные или нестабильные решения и сосредоточиться на перспективных кандидатах для дальнейшего синтеза и экспериментальной проверки.

Для разработки перспективных термокаталитических материалов (ТКМ) используются различные методы генеративного ИИ, включая генетические алгоритмы с оптимизацией по Парето (<span class="katex-eq" data-katex-display="false"> \mathbb{P} </span>), PL-MOGA для направленной многоцелевой оптимизации, а также вариационные автоэнкодеры (VAE) для кодирования лигандов и инверсного дизайна катализаторов на основе сжатого латентного пространства. — Для разработки перспективных термокаталитических материалов (ТКМ) используются различные методы генеративного ИИ, включая генетические алгоритмы с оптимизацией по Парето ( $\mathbb{P}$ ), PL-MOGA для направленной многоцелевой оптимизации, а также вариационные автоэнкодеры (VAE) для кодирования лигандов и инверсного дизайна катализаторов на основе сжатого латентного пространства.

Проверка дизайнов с помощью метрик SUN

Метрики SUN — Стабильность (Stability), Уникальность (Uniqueness) и Новизна (Novelty) — представляют собой комплексную систему оценки качества соединений, генерируемых алгоритмами искусственного интеллекта. Стабильность оценивает физико-химическую реализуемость структуры, исключая соединения с неправдоподобными или невозможными конфигурациями. Уникальность определяет, насколько сгенерированное соединение отличается от уже известных структур в базах данных, предотвращая повторное открытие известных материалов. Новизна, в свою очередь, измеряет отклонение сгенерированного соединения от существующего химического пространства, выявляя потенциально перспективные материалы с новыми свойствами. Комбинация этих трех метрик позволяет всесторонне оценить качество сгенерированных соединений и отфильтровать нереалистичные или избыточные варианты, фокусируясь на наиболее перспективных кандидатах для дальнейшего синтеза и характеризации.

Количественная оценка критических атрибутов, таких как стабильность, уникальность и новизна, позволяет исследователям эффективно отсеивать нереалистичные или избыточные конструкции при генерации молекул и материалов. Этот процесс фильтрации основан на расчете соответствующих метрик SUN (Stability, Uniqueness, Novelty) для каждого сгенерированного соединения. Отбраковка конструкций с низкими показателями по этим метрикам значительно сужает список кандидатов, требующих дальнейшего синтеза и экспериментальной характеризации, что оптимизирует ресурсы и повышает вероятность получения практически полезных материалов. Применение данного подхода позволяет сосредоточиться на наиболее перспективных соединениях, обладающих высокой вероятностью успешной реализации.

Модель MOFFUSION продемонстрировала впечатляющий уровень валидности в 81%, превзойдя предыдущие модели диффузионной генерации (DM). Этот результат указывает на повышенную способность MOFFUSION генерировать химически реалистичные и синтетически доступные соединения. Предыдущие DM модели демонстрировали значительно более низкие показатели валидности, что требовало более интенсивной фильтрации и верификации сгенерированных структур. Высокий процент валидности MOFFUSION снижает необходимость в ручной проверке и оптимизирует процесс поиска новых материалов, подтверждая эффективность подхода, основанного на оценке сгенерированных соединений.

Интеграция метрик SUN (Стабильность, Уникальность и Новизна) в рабочие процессы генеративного ИИ значительно повышает надежность и эффективность процесса открытия материалов, сокращая разрыв между компьютерным моделированием и экспериментальными исследованиями. Применение этих количественных показателей позволяет отфильтровывать нереалистичные или избыточные конструкции на ранних этапах, фокусируя ресурсы на перспективных кандидатах для синтеза и характеризации. В результате снижаются затраты времени и ресурсов, необходимые для валидации предложенных материалов, и увеличивается вероятность успешного получения новых соединений с заданными свойствами. Модели, использующие SUN метрики, демонстрируют повышенную валидность результатов, что подтверждается, например, 81%-ным показателем у модели MOFFUSION и трехпорядковым улучшением генерации валидных цеолитов моделью ZeoDiff по сравнению с ZeoGAN.

Недавние достижения в области генерации цеолитов с использованием диффузионных моделей, таких как ZeoDiff, продемонстрировали значительное улучшение валидности по сравнению с генеративно-состязательными сетями (GAN), в частности ZeoGAN. Показатели валидности, оцениваемые с помощью метрик SUN, указывают на увеличение количества генерируемых валидных структур цеолитов на три порядка величины. Это свидетельствует о повышенной эффективности диффузионных моделей в сочетании с метриками оценки качества, позволяя генерировать более реалистичные и синтезируемые материалы, что существенно ускоряет процесс открытия новых материалов.

Диффузионные модели, использующие представления кристаллической структуры с гауссовским шумом и E(3)-эквивариантные графовые нейронные сети, позволяют генерировать не-пористые неорганические кристаллы с качеством, близким к DFT, как в безусловном, так и в условном режимах, что подтверждается метриками SUN и экспериментальной верификацией.

Исследование возможностей генеративного искусственного интеллекта в проектировании неорганических соединений демонстрирует стремление к упрощению сложного. Авторы статьи, по сути, предлагают инструменты для создания материалов с заданными свойствами, избегая при этом избыточной детализации в процессе разработки. Это перекликается с мыслью Нильса Бора: «Противоположности кажутся противоположными, но на самом деле они взаимодополняют друг друга». Подобно тому, как ИИ балансирует между свободой творчества и необходимостью соответствовать заданным параметрам, Боровская философия подчеркивает важность признания взаимосвязи между различными аспектами реальности. В контексте предложенного подхода к материаловедению, генеративные модели стремятся к понятности — создавать структуры, которые можно предсказать и воспроизвести, что является проявлением вежливости к исследователю и потенциальному пользователю материала.

Что дальше?

Попытки автоматизировать поиск новых неорганических соединений посредством генеративных моделей, безусловно, представляют интерес. Однако, не стоит преувеличивать их революционный потенциал. Текущие алгоритмы, как правило, демонстрируют успех лишь в узких областях, часто воспроизводя известные решения, а не предлагая принципиально новые. Стремление к «дизайну» материалов, подобно алхимии, может упустить из виду фундаментальную неопределенность, присущую реальным системам.

Ключевым препятствием остается верификация предложенных структур. Расчеты свойств, необходимые для подтверждения полезности соединения, по-прежнему требуют значительных вычислительных ресурсов и часто опираются на приближенные методы. Более того, проблема обратной связи — включение экспериментальных данных в процесс обучения — остается нерешенной в полной мере. Необходимо сместить акцент с простого генерирования структур на разработку надежных методов оценки и валидации.

В конечном счете, истинный прогресс, вероятно, будет достигнут не путем создания все более сложных алгоритмов, а путем упрощения. Истина, как часто бывает, скрыта не в изобилии параметров, а в элегантности базовых принципов. Поиск новых материалов — это не инженерная задача, а своего рода философское упражнение, требующее от исследователя смирения перед сложностью природы.

Оригинал статьи: https://arxiv.org/pdf/2604.11827.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-04-15 06:52

🚀 Квантовые новости

Основы координационной химии и ретикулярных структур

Генеративный ИИ: Новый подход к дизайну материалов

Проверка дизайнов с помощью метрик SUN

Что дальше?

Смотрите также: