Дефекты как ключ к свойствам: моделирование COF с помощью машинного обучения

Автор: Денис Аветисян

Новый подход, основанный на квантово-обоснованных потенциалах машинного обучения, позволяет предсказывать теплопроводность и механические характеристики дефектных ковалентных органических каркасов.

Ковалентные органические каркасы (COF), состоящие из ключевых элементов и соединителей, демонстрируют возможность тонкой настройки свойств за счет модификации этих строительных блоков, что подтверждается анализом 36 000 конформаций COF с использованием метода главных компонент и последующим предсказанием тепловых и механических характеристик посредством обучения машинного потенциала на основе квантово-механических данных.

Разработанный потенциал машинного обучения позволяет проводить крупномасштабное моделирование дефектных COF для прогнозирования их тепловых и упругих свойств.

Несмотря на перспективность ковалентных органических каркасов (COF) в различных областях, влияние дефектов, неизбежно возникающих в процессе синтеза, на их свойства остается малоизученным. В работе «Data-Driven Thermal and Mechanical Modeling of Defective Covalent Organic Frameworks» представлен новый квантово-точный машинный потенциал (QCOF), позволяющий проводить крупномасштабное моделирование дефектных COF и предсказывать их теплопроводность и механические характеристики. Разработанная методика продемонстрировала высокую точность и эффективность при изучении влияния дефектов на свойства COF CTF-1 и COF-LZU1. Сможет ли данный подход стать основой для рационального дизайна новых, более прочных и эффективных материалов на основе COF?

Традиционные методы моделирования: между точностью и вычислительными затратами

Традиционное моделирование материалов с высокой точностью неизменно опирается на теорию функционала плотности (DFT), однако этот подход сопряжен со значительными вычислительными затратами. В основе DFT лежит решение сложного уравнения Шрёдингера для множества электронов в материале, что требует экспоненциального увеличения вычислительных ресурсов с ростом числа атомов в системе. В результате, даже для относительно небольших систем, проведение расчетов с использованием DFT может занимать часы, дни или даже недели на современных суперкомпьютерах. Это ограничивает возможность исследования динамических процессов, происходящих в материалах на реалистичных временных масштабах, а также моделирование свойств протяженных систем, таких как дефекты в кристаллах или границы зерен. В связи с этим, поиск альтернативных, более эффективных методов моделирования является актуальной задачей современной материаловедческой науки.

Традиционное моделирование материалов с высокой точностью, основанное на теории функционала плотности (DFT), сталкивается с существенными ограничениями, обусловленными вычислительными затратами. Эти затраты напрямую влияют на размер моделируемых систем и длительность временных интервалов, доступных для анализа сложного поведения материалов. Вследствие этого, исследование процессов, происходящих в масштабных структурах или требующих длительного наблюдения, становится затруднительным или вовсе невозможным с использованием только DFT. Например, моделирование дефектов в кристаллах, динамика межфазных границ или эволюция микроструктур в течение длительного времени оказываются недостижимы без применения альтернативных подходов, способных снизить вычислительную сложность, не жертвуя при этом точностью описания.

В связи с ограничениями традиционных методов моделирования материалов, обусловленными высокими вычислительными затратами, возникла необходимость в разработке альтернативных подходов, способных ускорить процесс симуляций. В качестве решения активно применяются так называемые суррогатные модели — потенциалы межатомного взаимодействия, основанные на методах машинного обучения. Эти модели, обученные на данных, полученных с помощью более точных, но ресурсоемких расчетов, позволяют аппроксимировать энергетические поверхности материалов и проводить симуляции с существенно меньшими затратами, открывая возможности для изучения систем гораздо большего размера и в течение более длительных временных интервалов. Использование машинного обучения в данной области позволяет существенно расширить границы применимости моделирования материалов, позволяя исследовать сложные явления и прогнозировать свойства материалов с беспрецедентной эффективностью.

Модель QCOF демонстрирует беспрецедентный масштаб моделирования, позволяя исследовать системы, состоящие до 140 000 атомов. Этот показатель значительно превосходит возможности традиционных методов, таких как теория функционала плотности (DFT), которые ограничены вычислительными ресурсами при работе со столь крупными системами. В отличие от универсальных моделей межмолекулярного взаимодействия (MACE), QCOF оптимизирована для достижения высокой точности и эффективности при моделировании материалов с большим количеством атомов, открывая новые перспективы для изучения сложных материалов и процессов, ранее недоступных для детального анализа. Такой подход позволяет проводить симуляции, более точно отражающие реальное поведение материалов в различных условиях, что критически важно для разработки новых технологий и материалов будущего.

Модель QCOF демонстрирует оптимальное соотношение между точностью предсказания сил, объемом используемой памяти (до <span class="katex-eq" data-katex-display="false">5000</span> атомов на GPU) и скоростью вычислений, занимая доминирующее положение на фронте Парето, в то время как модели, обученные с нуля (круги) и универсальные MACE модели (квадраты и звезды) уступают ей по этим параметрам. — Модель QCOF демонстрирует оптимальное соотношение между точностью предсказания сил, объемом используемой памяти (до $5000$ атомов на GPU) и скоростью вычислений, занимая доминирующее положение на фронте Парето, в то время как модели, обученные с нуля (круги) и универсальные MACE модели (квадраты и звезды) уступают ей по этим параметрам.

Симметрия в расчетах: эквивариантные нейронные сети

Традиционные нейронные сети, в отличие от систем, основанных на принципах симметрии, не обладают встроенным пониманием физических симметрий, присутствующих в данных. Это приводит к неэффективному представлению данных и, как следствие, к потенциальным неточностям в предсказаниях. Отсутствие учета симметрии требует от сети обучения представлению информации, которая уже изначально симметрична, что увеличивает объем необходимых параметров и вычислительные затраты. Кроме того, игнорирование симметрий может привести к обобщающим ошибкам и снижению точности предсказаний, особенно при экстраполяции на новые, ранее не встречавшиеся данные. В результате, для достижения приемлемой точности, традиционным сетям требуется значительно больше данных и вычислительных ресурсов по сравнению с архитектурами, учитывающими симметрии.

Архитектуры эквивариантных нейронных сетей, такие как NequIP, GRACE, So3krates и Allegro, разработаны с учетом принципов симметрии, что позволяет им корректно обрабатывать данные, подверженные преобразованиям, таким как вращения и перестановки. В отличие от традиционных нейронных сетей, которые не учитывают эти симметрии, эквивариантные сети обеспечивают, что выходные данные сети преобразуются предсказуемым образом при изменении входных данных в соответствии с заданными симметриями. Это достигается за счет использования специальных слоев и функций активации, которые учитывают групповые свойства симметрии, что приводит к более эффективным и точным моделям, особенно в задачах, связанных с физикой и химией, где симметрия играет ключевую роль.

Архитектура MACE, основанная на принципах сохранения симметрий, предоставляет надежную основу для построения точных и эффективных межатомных потенциалов машинного обучения. Она использует симметричные представления данных, что позволяет снизить вычислительные затраты и повысить обобщающую способность модели. В отличие от традиционных подходов, MACE позволяет создавать потенциалы, инвариантные к вращениям, переносам и отражениям, что критически важно для моделирования физических систем. Данная архитектура расширяет возможности, представленные в других подходах, таких как Gaussian Regression Potential и Moment Tensor Potential, обеспечивая более высокую точность и эффективность при моделировании энергии и сил между атомами.

Архитектура MACE развивает возможности, реализованные в более ранних подходах, таких как Gaussian Regression Potential (GRP) и Moment Tensor Potential (MTP). В частности, MACE наследует способность GRP к эффективному представлению электронных плотностей и предсказанию энергий, а также использует концепцию дескрипторов, применяемую в MTP, для учета локального окружения атомов. Однако, MACE расширяет эти возможности, используя более сложные и выразительные дескрипторы и обеспечивая более точное моделирование многоатомных взаимодействий, что позволяет достичь повышенной точности и эффективности в задачах молекулярной динамики и моделирования материалов. $RMSE$ потенциала, построенного на основе MACE, демонстрирует улучшенные показатели по сравнению с традиционными подходами.

Лучшая модель QCOF с конфигурацией (128-1-4) продемонстрировала среднеквадратичную ошибку силы (RMSE) в 25.4 мэВ Å⁻¹ на валидационном наборе данных. Этот показатель RMSE измеряет отклонение предсказанных сил между атомами от эталонных значений, вычисленных с использованием более точных, но вычислительно затратных методов. Значение 25.4 мэВ Å⁻¹ указывает на высокую точность модели в предсказании сил, что критически важно для моделирования динамики материалов и проведения симуляций молекулярной динамики. Конфигурация (128-1-4) определяет архитектуру модели, включая количество узлов в слоях нейронной сети и параметры регуляризации, оптимизированные для достижения минимальной ошибки на валидационном наборе.

Обученные модели машинного обучения демонстрируют хорошую обобщающую способность на новых химических соединениях и дефектах COF-LZU1 и CTF-1, сохраняя высокую точность и нечувствительность к изменениям размера пор, что подтверждается расчетами дисперсии фононов <span class="katex-eq" data-katex-display="false">C_2N</span> и <span class="katex-eq" data-katex-display="false">t-C_3N_4</span> с использованием различных методов. — Обученные модели машинного обучения демонстрируют хорошую обобщающую способность на новых химических соединениях и дефектах COF-LZU1 и CTF-1, сохраняя высокую точность и нечувствительность к изменениям размера пор, что подтверждается расчетами дисперсии фононов $C_2N$ и $t-C_3N_4$ с использованием различных методов.

Валидация QCOF: прогнозирование свойств ковалентных органических каркасов

Разработанный потенциал QCOF, основанный на архитектуре MACE, был применен для моделирования поведения ковалентных органических каркасов (COF) LZU1 и CTF-1. Архитектура MACE позволила представить взаимодействия между атомами в этих материалах, что необходимо для точного предсказания их механических и теплопроводных свойств. Моделирование проводилось для оценки способности потенциала QCOF воспроизводить наблюдаемое поведение COF, представляющих интерес для различных применений, включая хранение газов и катализ. Выбор COF-LZU1 и CTF-1 обусловлен их различной структурой и свойствами, что позволило протестировать универсальность разработанного потенциала.

Для оценки способности разработанного потенциала QCOF предсказывать механические свойства (модуль Юнга) и теплопроводность, были проведены испытания на одноосное растяжение и неравновесная молекулярная динамика. В рамках этих симуляций, деформация материалов моделировалась посредством приложения одноосного напряжения, а теплопроводность определялась путем анализа потока энергии в неравновесных условиях. Полученные результаты позволили сопоставить предсказанные значения с известными экспериментальными данными и результатами других вычислительных исследований, подтверждая адекватность и точность потенциала QCOF.

Разработанный потенциал QCOF, основанный на архитектуре MACE, продемонстрировал высокую точность предсказания поведения ковалентных органических каркасов (COF) LZU1 и CTF-1. В частности, расчеты QCOF для двумерного модуля Юнга (Y) материала CTF-1 составили 69 ГПа, что сопоставимо с экспериментальными данными и находится в пределах 10% от их значений. Кроме того, предсказанная теплопроводность (κ) материала C₂N составила 88.9 ± 92 Вт/(м·К), что согласуется с результатами предыдущих вычислительных исследований (82.22 Вт/(м·К)). Эти результаты подтверждают надежность и переносимость потенциала QCOF для моделирования различных COF-структур и прогнозирования их физико-механических свойств.

По результатам моделирования, двухмерный модуль Юнга (Y) для CTF-1, предсказанный разработанным потенциалом QCOF, составил 69 ГПа. Данное значение находится в хорошем согласии с экспериментальными данными и отличается от них не более чем на 10%. Такое соответствие подтверждает адекватность потенциала QCOF при моделировании механических свойств ковалентных органических каркасов и демонстрирует его способность к точному предсказанию ключевых параметров материала, таких как модуль упругости.

Потенциал QCOF предсказал теплопроводность (κ) материала C₂N равной 88.9 ± 92 Вт/(м·К). Данное значение согласуется с результатами предыдущих вычислительных исследований, в которых было получено значение теплопроводности 82.22 Вт/(м·К). Соответствие предсказанных и ранее полученных данных подтверждает адекватность и надежность разработанного потенциала QCOF при моделировании теплофизических свойств ковалентных органических каркасов.

Моделирование теплопроводности показало, что дефекты оказывают значительно большее влияние на CTF-1, чем на COF-LZU1, что подтверждается анализом среднеквадратичного смещения атомов и соответствием экспериментальным данным, полученным при измерении теплопроводности C2N в различных направлениях и при использовании <span class="katex-eq" data-katex-display="false">Eq.3</span>. — Моделирование теплопроводности показало, что дефекты оказывают значительно большее влияние на CTF-1, чем на COF-LZU1, что подтверждается анализом среднеквадратичного смещения атомов и соответствием экспериментальным данным, полученным при измерении теплопроводности C2N в различных направлениях и при использовании $Eq.3$ .

Влияние дефектов на свойства материалов

Несмотря на стремление к совершенству в материаловедении, реальные материалы неизменно содержат дефекты — отклонения от идеальной кристаллической структуры. Эти дефекты, будь то точечные вакансии, дислокации или границы зерен, оказывают существенное влияние на ключевые свойства материалов. В частности, механические характеристики, такие как прочность и пластичность, напрямую зависят от способности материала противостоять распространению дефектов под нагрузкой. Аналогично, теплопроводность материала снижается из-за рассеяния фононов на дефектах, препятствующих эффективной передаче тепла. Таким образом, понимание и учет дефектов является фундаментальным для прогнозирования и оптимизации характеристик материалов в самых разнообразных областях — от создания прочных конструкционных материалов до разработки эффективных теплоотводящих систем.

Моделирование дефектов в структурах COF-LZU1 и CTF-1 является ключевым для получения реалистичного представления об их поведении. Эти ковалентные органические каркасы, обладающие потенциалом для широкого спектра применений, неизбежно содержат структурные несовершенства. Простое игнорирование этих дефектов в теоретических расчетах приводит к значительному искажению предсказываемых свойств материала. Точное воспроизведение дефектов в моделях позволяет учитывать их влияние на такие важные характеристики, как механическая прочность и теплопроводность, что необходимо для надежного прогнозирования производительности в реальных условиях эксплуатации. Использование вычислительных методов, учитывающих эти несовершенства, открывает возможности для целенаправленной модификации структуры материалов и оптимизации их свойств для конкретных задач.

Наличие дефектов в структуре материалов оказывает существенное влияние на ключевые механические и теплофизические характеристики. Исследования показывают, что даже незначительные структурные несовершенства заметно снижают модуль Юнга — меру жесткости материала, определяющую его сопротивление деформации. Одновременно с этим, дефекты действуют как центры рассеяния фононов, что приводит к снижению теплопроводности — способности материала проводить тепло. Таким образом, учет дефектов является критически важным при разработке новых материалов с заданными свойствами, поскольку позволяет оптимизировать их характеристики для конкретных применений, будь то создание прочных и гибких конструкционных элементов или эффективных теплоотводящих систем. Влияние дефектов на $E = \sigma / \epsilon$ и теплопроводность подчеркивает необходимость точного моделирования и контроля дефектов при проектировании материалов.

Точное моделирование влияния дефектов на свойства материалов имеет решающее значение для прогнозирования их поведения в реальных условиях эксплуатации. Несмотря на то, что идеальная кристаллическая структура является теоретическим понятием, все реальные материалы содержат различные дефекты, которые существенно изменяют такие характеристики, как модуль Юнга и теплопроводность. Игнорирование этих несовершенств при разработке и тестировании материалов может привести к неверным прогнозам их долговечности и надежности в сложных условиях, будь то высокие температуры, механические нагрузки или агрессивные среды. Таким образом, современные вычислительные методы, позволяющие учитывать дефекты при моделировании, становятся незаменимым инструментом для инженеров и материаловедов, стремящихся создавать более прочные, долговечные и эффективные материалы для широкого спектра применений — от авиакосмической промышленности до биомедицины.

Испытания на одноосное растяжение показали, что дефекты снижают прочность материалов CTF-1 и COF-LZU1, при этом для COF-LZU1 с дефектом в 585 точек наблюдается анизотропия деформации вдоль направлений зигзага и кресла.

Исследование, посвященное моделированию дефектных ковалентных органических каркасов, неизбежно наталкивается на проблему точности и масштабируемости. Авторы предлагают подход, основанный на машинном обучении, что, конечно, вызывает легкую иронию. Ведь каждая «революционная» технология завтра станет техдолгом. Попытки создать самовосстанавливающиеся системы, предсказанные моделями, кажутся наивными — ведь всё, что обещает быть self-healing, просто ещё не ломалось. Впрочем, предсказание теплопроводности и упругих свойств дефектных материалов с использованием QCOF — это не просто академический интерес. Как заметил Поль Фейерабенд: «Метод — это не способ решения проблемы. Это проблема». Ведь именно выбор метода, будь то квантовые расчеты или машинное обучение, определяет границы познания и, как следствие, возможности материаловедения.

Что дальше?

Очевидно, что создание «квантово-обоснованных» потенциалов машинного обучения для ковалентных органических каркасов — это, безусловно, прогресс. Но давайте не будем строить иллюзий. Каждая новая библиотека потенциалов — это лишь ещё одна попытка обернуть старые проблемы с точностью в красивую упаковку. И, конечно же, в реальности, реальные дефекты в материалах всегда будут гораздо сложнее тех, что смоделированы даже самыми продвинутыми алгоритмами. Прогнозирование теплопроводности и упругих свойств — это хорошо, но кто-нибудь подумал о долгосрочной стабильности этих каркасов в условиях реальной эксплуатации?

Вполне вероятно, что в ближайшем будущем, вместо того, чтобы стремиться к идеальной точности моделирования, исследователи сосредоточатся на создании более устойчивых и робастных моделей, которые хорошо работают даже при наличии значительных отклонений от идеальной структуры. И, разумеется, появится новая волна «оптимизированных» алгоритмов, которые обещают вдвое ускорить расчёты, но на деле просто добавят ещё один уровень абстракции и неопределённости.

В конечном итоге, всё это — лишь очередная ступень в бесконечном цикле «инноваций». И, как показывает опыт, всё новое — это просто старое с худшей документацией. Но, возможно, в этот раз, нам удастся создать материал, который продержится хоть немного дольше, прежде чем его разрушит очередной «улучшенный» метод синтеза.

Оригинал статьи: https://arxiv.org/pdf/2604.21494.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-04-25 02:40

🚀 Квантовые новости