Искусственный интеллект предсказывает дефекты в материалах с высокой точностью

Автор: Денис Аветисян

Новый подход, основанный на машинном обучении, позволяет эффективно моделировать энергетику и структуру точечных дефектов в заряженных кристаллических решетках.

Оценка отклонений предсказанных машинными потенциалами структур дефектов от расчетов теории функционала плотности выявила существенные погрешности, проявляющиеся в значительном увеличении среднеквадратического отклонения (RMSD) для дефекта <span class="katex-eq" data-katex-display="false">V_{Sb}</span> в <span class="katex-eq" data-katex-display="false">Sb_2Se_3</span> при различных зарядовых состояниях, что указывает на неспособность базовых моделей точно воспроизводить энергетические поверхности дефектов и локальное атомное окружение, особенно при экстремальных зарядах. — Оценка отклонений предсказанных машинными потенциалами структур дефектов от расчетов теории функционала плотности выявила существенные погрешности, проявляющиеся в значительном увеличении среднеквадратического отклонения (RMSD) для дефекта $V_{Sb}$ в $Sb_2Se_3$ при различных зарядовых состояниях, что указывает на неспособность базовых моделей точно воспроизводить энергетические поверхности дефектов и локальное атомное окружение, особенно при экстремальных зарядах.

Разработана методика обучения межмолекулярных потенциалов с использованием многоуровневого подхода и учета заряда для точного предсказания свойств дефектов в материалах.

Несмотря на успехи машинного обучения в предсказании свойств идеальных кристаллических структур, описание дефектов, влияющих на функциональность материалов, остается сложной задачей. В работе ‘Multi-fidelity Machine Learning Interatomic Potentials for Charged Point Defects’ представлен подход, сочетающий в себе обучение межмолекулярных потенциалов с использованием вложений, учитывающих заряд дефекта, и многоуровневый подход к выбору данных для обучения. Разработанные потенциалы позволяют достоверно предсказывать стабильные конфигурации дефектов и уровни переходов, согласуясь с результатами квантово-механических расчетов, но при значительно меньших вычислительных затратах. Возможно ли с помощью подобных методов эффективно моделировать сложные дефекты и предсказывать их влияние на свойства новых материалов?

Вызов точного моделирования дефектов

Дефекты в кристаллической структуре материалов играют фундаментальную роль в определении их физических, химических и механических свойств. Даже незначительные отклонения от идеальной решетки, такие как вакансии, междоузельные атомы или дислокации, могут существенно влиять на электропроводность, прочность, пластичность и другие ключевые характеристики. Например, в полупроводниках дефекты служат центрами рекомбинации носителей заряда, определяя эффективность электронных устройств. В металлах они влияют на процессы деформации и разрушения, а в керамике могут стать очагами зарождения трещин. Таким образом, глубокое понимание природы и поведения дефектов необходимо для целенаправленного создания материалов с заданными свойствами и улучшения их эксплуатационных характеристик.

Традиционные методы, такие как теория функционала плотности (DFT), несмотря на свою широкую распространенность в материаловедении, сталкиваются со значительными вычислительными трудностями при моделировании дефектов в сложных структурах. Это связано с тем, что точное описание электронного строения и энергии дефекта требует учета большого числа атомов в окружении дефекта, а также сложных взаимодействий между ними. Вычислительная стоимость этих расчетов растет экспоненциально с увеличением размера системы и сложности дефекта, что делает исследование дефектов в реальных материалах, содержащих множество дефектов и примесей, чрезвычайно трудоемким и часто невозможным. В результате, исследователям приходится прибегать к упрощениям и приближениям, которые могут существенно повлиять на точность результатов и адекватность моделирования.

Для точного прогнозирования поведения дефектов в материалах необходимы вычислительно эффективные методы, способные исследовать огромные пространства конфигураций. Это обусловлено тем, что дефекты, даже в относительно простых структурах, могут занимать множество стабильных и метастабильных положений, а их взаимодействие с окружающей матрицей существенно влияет на свойства материала. Традиционные подходы, такие как методы Монте-Карло или молекулярная динамика, часто сталкиваются с проблемой поиска глобального минимума энергии в этих сложных ландшафтах. Разработка новых алгоритмов и использование современных вычислительных мощностей направлены на преодоление этих ограничений, позволяя моделировать более реалистичные дефекты и предсказывать их влияние на механические, электронные и другие характеристики материалов. Эффективное исследование этих конфигурационных пространств открывает возможности для целенаправленного проектирования материалов с заданными свойствами и улучшения их эксплуатационных характеристик.

Анализ главных компонент (PCA) атомных дескрипторов для VSeV\text{Se} в Sb2Se3 показывает влияние глобальных вложений заряда на латентное пространство, а сравнение предсказаний модели MACE с вложениями заряда и расчетов HSE06 для энергий, сил и геометрии дефектов демонстрирует высокую точность и соответствие теоретическим данным, подтвержденные низкими среднеквадратичными ошибками (RMSE) и близким расположением термодинамических уровней перехода, полученных с помощью MLIP и HSE06.

Машинное обучение потенциалов: новый подход к моделированию

Машинное обучение межатомных потенциалов (MLIP) предоставляет возможность значительно ускорить моделирование материалов. Традиционные методы, такие как молекулярная динамика, требуют вычисления сил между атомами на каждом шаге, что является вычислительно затратным. MLIP заменяют эти вычисления на предсказания, основанные на обученной модели, что позволяет проводить симуляции в масштабах времени и размеров, недоступных для ab initio методов. Эффективность MLIP обусловлена способностью модели аппроксимировать сложные взаимодействия между атомами, используя данные, полученные из высокоточных расчетов, например, теории функционала плотности (DFT). В результате, время, необходимое для моделирования материальных свойств, может быть сокращено на несколько порядков, открывая новые возможности для исследования и разработки материалов.

Потенциалы межатомного взаимодействия, основанные на машинном обучении (MLIP), позволяют моделировать энергетические ландшафты материалов, используя данные, полученные высокоточными методами, такими как расчеты в рамках теории функционала плотности (DFT). Вместо прямого решения сложных квантово-механических уравнений, MLIP обучаются на наборе данных, содержащем энергии и силы, действующие на атомы в различных конфигурациях. После обучения, MLIP могут быстро и эффективно предсказывать энергию и силы для новых, ранее не исследованных атомных конфигураций, что значительно ускоряет симуляции свойств материалов, например, динамическое поведение, фазовые переходы и механические характеристики. Точность предсказаний напрямую зависит от репрезентативности и объема обучающих данных, а также от выбора архитектуры модели машинного обучения.

Точность машинного обучения межмолекулярных потенциалов (MLIP) напрямую зависит от качества и объема обучающих данных, которые, как правило, генерируются с использованием теории функционала плотности (DFT). Недостаточное количество данных или наличие в них ошибок может привести к неточным предсказаниям свойств материалов. Более того, выбор представленных в данных структур и условий (температура, давление) оказывает существенное влияние на область применимости и точность полученного MLIP. Для достижения высокой точности MLIP требуется создание обширных и репрезентативных наборов данных, включающих разнообразные конфигурации атомов и соответствующие им энергии, рассчитанные с высокой точностью, обычно посредством DFT расчетов.

В архитектуре MACE глобальные вложения заряда для точечных дефектов интегрируются в начальные атомные вложения, влияя на итеративное обновление узловых признаков <span class="katex-eq" data-katex-display="false">h_{i}^{(t)}</span> через функцию взаимодействия <span class="katex-eq" data-katex-display="false">f_{ heta}</span> и формируя энергию взаимодействия <span class="katex-eq" data-katex-display="false">E_{inter}</span>, которая в сумме с геометрически-независимой энергией вложений <span class="katex-eq" data-katex-display="false">E_{emb}</span> и атомными опорными энергиями <span class="katex-eq" data-katex-display="false">E_{0}</span> определяет общую энергию системы <span class="katex-eq" data-katex-display="false">E_{tot}</span>. — В архитектуре MACE глобальные вложения заряда для точечных дефектов интегрируются в начальные атомные вложения, влияя на итеративное обновление узловых признаков $h_{i}^{(t)}$ через функцию взаимодействия $f_{ heta}$ и формируя энергию взаимодействия $E_{inter}$ , которая в сумме с геометрически-независимой энергией вложений $E_{emb}$ и атомными опорными энергиями $E_{0}$ определяет общую энергию системы $E_{tot}$ .

Усиление MLIP для дефектов с зарядом

Дефекты с зарядом представляют собой особую проблему для моделей межатомного потенциала (MLIP) из-за дальнодействующего характера электростатических взаимодействий. В отличие от взаимодействий, локализованных между ближайшими атомами, электростатическое взаимодействие Кулона ослабевает пропорционально расстоянию, но распространяется на значительные области кристалла. Это требует учета взаимодействия между дефектом и всеми другими заряженными частицами в системе, что значительно увеличивает вычислительную сложность и может приводить к ошибкам при использовании стандартных MLIP, разработанных для локальных взаимодействий. Необходимо применять специальные методы, такие как встраивание глобального заряда, для адекватного моделирования этих дальнодействующих эффектов и обеспечения точности предсказаний.

Глобальное встраивание заряда (Global Charge Embedding) представляет собой метод явного включения информации о заряде в модели потенциала межмолекулярных взаимодействий (MLIP). В отличие от традиционных подходов, которые неявно учитывают электростатические взаимодействия, данная методика напрямую включает заряд в описание системы. Это достигается путем добавления в MLIP компонентов, учитывающих распределение заряда и его влияние на энергию и силы, действующие между атомами. Внедрение глобального встраивания заряда существенно повышает точность предсказания свойств дефектов с зарядом, особенно в материалах с сильными электростатическими взаимодействиями, обеспечивая более реалистичное моделирование их поведения.

Использование эквивариантных моделей, таких как MACE, обеспечивает сохранение инвариантности машинных потенциалов (MLIP) относительно вращений и трансляций, что критически важно для физической достоверности. Эквивариантность означает, что предсказания модели изменяются предсказуемым образом при изменении ориентации или положения системы, отражая фундаментальные принципы физики. MACE (Machine learning for Atomic ConfiguRation Environments) — это конкретный тип эквивариантной нейронной сети, разработанный для моделирования межатомных взаимодействий с учетом симметрий, что позволяет получать более точные и надежные результаты при моделировании дефектов в кристаллических структурах.

Комбинирование методов Global Charge Embedding и использования эквивариантных моделей, таких как MACE, позволяет достичь высокой точности предсказания характеристик дефектов в материалах. В частности, конфигурации основного состояния дефектов предсказываются с погрешностью не более 0.05 Å, а уровни энергетического перехода заряда — с точностью до 0.01 eV. Достижение таких показателей позволяет проводить надежное моделирование свойств материалов, содержащих дефекты, и предсказывать их влияние на различные физические характеристики.

Многоуровневая стратегия поиска структуры нейтрального VSeV<sub>Se</sub>, использующая машинное обучение потенциалов (MLIP), позволяет эффективно находить истинный глобальный минимум (обозначен красной звездой) и метастабильные минимумы (серый круг), снижая вычислительные затраты по сравнению со стандартным подходом, основанным на последовательном уточнении потенциальной энергии с использованием высокоточных методов (зеленая линия) и последующей релаксацией (серые стрелки), благодаря использованию низкоточных расчетов (синяя линия) и коррекций Δ-обучения (оранжевые стрелки). — Многоуровневая стратегия поиска структуры нейтрального VSeV_Se, использующая машинное обучение потенциалов (MLIP), позволяет эффективно находить истинный глобальный минимум (обозначен красной звездой) и метастабильные минимумы (серый круг), снижая вычислительные затраты по сравнению со стандартным подходом, основанным на последовательном уточнении потенциальной энергии с использованием высокоточных методов (зеленая линия) и последующей релаксацией (серые стрелки), благодаря использованию низкоточных расчетов (синяя линия) и коррекций Δ-обучения (оранжевые стрелки).

Эффективный поиск структур дефектов

Исследование поверхности потенциальной энергии (ППЭ) применительно к дефектам в кристаллических структурах требует применения надежных алгоритмов структурного поиска, таких как ShakeNBreak. Данный подход основан на итеративном релаксировании и перестановке атомов, позволяя эффективно преодолевать энергетические барьеры и находить стабильные конфигурации дефектов, которые могли бы быть упущены при использовании более простых методов. ShakeNBreak отличается способностью «встряхивать» систему, выводя её из локальных минимумов и стимулируя поиск глобального минимума энергии, что особенно важно для сложных дефектов с множеством степеней свободы. Эффективность алгоритма заключается в сочетании методов молекулярной динамики и локальной оптимизации, обеспечивая высокую скорость и точность при исследовании ППЭ.

Для существенного снижения вычислительных затрат при поиске стабильных дефектных структур применяется многоуровневый подход. Он заключается в комбинировании расчетов с использованием функционала плотности PBE, отличающегося низкой вычислительной сложностью, с более точными, но ресурсоемкими расчетами на основе функционала HSE06. Изначально проводится грубый поиск с PBE, позволяющий быстро оценить потенциальную энергию различных конфигураций дефекта. Затем наиболее перспективные структуры подвергаются более детальному анализу с использованием HSE06, что обеспечивает высокую точность определения стабильных состояний при значительном сокращении общего времени вычислений. Такой гибридный подход позволяет эффективно исследовать сложное пространство конфигураций и идентифицировать энергетически благоприятные дефекты, что критически важно для понимания и предсказания свойств материалов.

Комбинация методов расчёта, усиленная машинными моделями межatomных потенциалов (MLIPs), значительно повышает эффективность поиска стабильных конфигураций дефектов в материалах. Традиционные подходы, требующие высокоточных, но ресурсоёмких расчётов для каждой потенциальной структуры, оказываются крайне затратными. Использование MLIPs позволяет предварительно отсеивать неперспективные конфигурации с высокой скоростью, а затем проводить более точные расчёты только для наиболее вероятных кандидатов. Такой подход позволяет не только ускорить процесс поиска, но и исследовать более широкий спектр возможных дефектов, что критически важно для понимания и прогнозирования свойств материалов.

Разработанный подход к поиску стабильных дефектных структур демонстрирует значительное снижение вычислительных затрат, достигающее трех порядков величины по сравнению с традиционными методами. Это существенное улучшение стало возможным благодаря комбинации высокоточных расчетов HSE06 с более быстрыми PBE вычислениями, дополненной применением машинного обучения потенциалов (MLIPs). Такое сочетание позволяет эффективно исследовать пространство конфигураций дефектов, избегая необходимости в дорогостоящих расчётах для каждой возможной структуры. В результате, поиск оптимальных конфигураций становится практически осуществимым даже для сложных материалов и дефектов, открывая новые возможности для материаловедения и разработки новых технологий.

К предсказуемому конструированию материалов

Точное моделирование дефектов в материалах является основополагающим для прогнозирования их поведения, и современные методы машинного обучения потенциалов (MLIP) в сочетании с эффективными алгоритмами поиска открывают новые возможности в этой области. Эти подходы позволяют рассчитывать энергию и структуру дефектов с высокой точностью, что критически важно для понимания влияния дефектов на электрические, оптические и механические свойства материалов. Развитие MLIP, способных описывать сложные взаимодействия между атомами, в сочетании с методами, оптимизирующими поиск наиболее стабильных конфигураций дефектов, позволяет исследователям предсказывать, как дефекты будут формироваться, мигрировать и взаимодействовать друг с другом в различных условиях, что является ключевым шагом на пути к целенаправленному конструированию материалов с заданными характеристиками.

Диаграммы координатных путей (Configuration Coordinate Diagrams, CCD) становятся мощным инструментом для изучения процессов захвата носителей заряда в материалах благодаря развитию машинного обучения потенциалов (MLIP). Эти диаграммы, визуализирующие изменение энергии системы по мере продвижения реакции, позволяют детально проанализировать кинетику захвата, выявляя энергетические барьеры и промежуточные состояния. Используя MLIP для точного моделирования энергии системы, исследователи могут создавать CCD для различных дефектов и материалов, что дает возможность предсказывать эффективность захвата носителей заряда и, следовательно, оптимизировать свойства материалов для конкретных применений, например, в солнечной энергетике или электронике. Такой подход позволяет не только понимать фундаментальные механизмы захвата, но и рационально проектировать материалы с заданными характеристиками.

Возможность точного моделирования дефектов и предсказания поведения материалов открывает новую эру в рациональном материаловедении. Вместо эмпирических подходов, основанных на случайном поиске, исследователи получают инструмент для целенаправленной разработки материалов с заданными свойствами. Это позволяет, например, оптимизировать материалы для солнечных батарей, повышая эффективность преобразования энергии, или создавать более долговечные и эффективные катализаторы для химических реакций. Благодаря возможности предсказывать, как изменения в составе или структуре материала повлияют на его функциональные характеристики, инженеры могут разрабатывать материалы, идеально подходящие для конкретных задач, значительно сокращая время и затраты на разработку и производство, а также открывая двери для инновационных технологических решений.

Дальнейшие исследования направлены на существенное усовершенствование моделей межатомного потенциала (MLIP), что позволит достичь ещё большей точности в прогнозировании свойств материалов. Особое внимание уделяется расширению сферы применения этих методов на более сложные системы, включающие различные типы дефектов и многокомпонентные соединения. Разработка MLIP, способных адекватно описывать поведение материалов в экстремальных условиях, таких как высокие температуры или давления, является ключевой задачей. Это позволит не только предсказывать существующие свойства, но и рационально конструировать материалы с заданными характеристиками для конкретных приложений, открывая новые возможности в материаловедении и технологиях.

Исследование демонстрирует, что машинное обучение, примененное к расчету дефектов в материалах, представляет собой не абсолютную истину, а скорее компромисс между точностью и вычислительной эффективностью. Авторы, используя многоуровневый подход к обучению моделей, стремятся оптимизировать этот компромисс, позволяя предсказывать свойства дефектов с приемлемой точностью, не прибегая к непомерным вычислительным затратам. Как заметил Эпикур: “Не тот беден, кто мало имеет, а тот, кто много желает.” В данном контексте, “мало” — это ограниченные вычислительные ресурсы, а “много” — стремление к абсолютной точности модели. Оптимизация, таким образом, заключается в достижении баланса, достаточного для решения поставленной задачи, а не в погоне за недостижимым идеалом. Моделирование дефектов, как и любая научная деятельность, требует критического подхода и осознания границ применимости используемых инструментов.

Что дальше?

Представленная работа, безусловно, демонстрирует способность машинного обучения к аппроксимации потенциальных энергий дефектов в материалах. Однако, не стоит обольщаться иллюзией полной адекватности. Каждая метрика, даже самая тщательно выверенная, несет в себе идеологию, отражая выбор исследователя, его предпосылки о важном и неважном. Если показатели точности растут, значит, кто-то, вероятно, неправильно измерял раньше — или просто изменил критерии. Вопрос не в достижении абсолютной точности, а в понимании границ применимости модели.

Следующим шагом представляется не столько увеличение объема обучающих данных, сколько разработка методов оценки неопределенности. Необходимо научиться определять, в каких областях фазового пространства модель выдает надежные предсказания, а где ее результаты следует воспринимать с глубоким скептицизмом. Особенно актуальным представляется учет влияния динамических эффектов — дефекты в реальных материалах не статичны, и их поведение во времени может существенно влиять на свойства.

И, пожалуй, самое важное — признать, что машинное обучение — это лишь инструмент. Он может ускорить расчеты, но не заменит фундаментального понимания физики материала. Истинное знание рождается не из одной модели, а из последовательности проверок, ошибок и сомнений. А значит, необходимо продолжать развивать как вычислительные методы, так и экспериментальные подходы, чтобы получить более полную картину поведения дефектов в материалах.

Оригинал статьи: https://arxiv.org/pdf/2603.05238.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-03-07 20:47

🚀 Квантовые новости