Автор: Денис Аветисян
Исследователи разработали инновационную стратегию конструирования данных для создания стабильных и точных моделей машинного обучения, предсказывающих поведение жидких металлов.

Разработан физически обоснованный метод инженерии наборов данных для обучения межатомных потенциалов, позволяющий эффективно моделировать динамику жидких металлов без использования дорогостоящих ab initio расчетов.
Несмотря на важность жидких металлов для энергетики и ядерных технологий, количественное понимание их термофизических свойств остается ограниченным. В работе ‘Stable Machine Learning Potentials for Liquid Metals via Dataset Engineering’ предложен новый подход к созданию стабильных и точных межмолекулярных потенциалов машинного обучения для моделирования жидких металлов. Ключевым нововведением является физически обоснованная стратегия конструирования обучающих данных, использующая икосаэдрический короткодействующий порядок и систематические возмущения кристаллических структур. Позволит ли этот метод преодолеть ограничения традиционных подходов, основанных на дорогостоящих ab initio расчетах, и открыть путь к предсказательному моделированию поведения жидких металлов в широком диапазоне условий?
Сложность моделирования: вызов для материаловедения
Точное моделирование жидких металлов имеет первостепенное значение для развития материаловедения и инженерных приложений, однако традиционные методы, такие как расчеты методом молекулярной динамики из первых принципов (AIMD), оказываются непомерно затратными с точки зрения вычислительных ресурсов, что ограничивает возможность изучения процессов в доступных временных масштабах. Несмотря на высокую точность, эти подходы испытывают трудности при воспроизведении долгосрочной динамики, необходимой для понимания явлений диффузии и фазовых переходов. Ограниченность вычислительных мощностей становится серьезным препятствием для прогресса в разработке и оптимизации материалов с заданными свойствами, поскольку не позволяет исследовать их поведение в реальных условиях эксплуатации и прогнозировать их долговечность.
Несмотря на высокую точность, методы первопринципных расчетов, такие как молекулярная динамика ab initio, испытывают значительные трудности при моделировании долгосрочной динамики жидких металлов. Это связано с тем, что процессы, определяющие макроскопические свойства материалов — диффузия атомов, фазовые переходы, формирование микроструктуры — происходят в течение времени, существенно превышающего возможности стандартных расчетов. Для адекватного описания этих явлений необходимо учитывать взаимодействие большого числа атомов на протяжении длительного времени, что требует колоссальных вычислительных ресурсов. Таким образом, хотя эти методы способны точно определить межатомные силы, они часто оказываются недостаточными для понимания эволюции структуры жидкого металла и прогнозирования его поведения в реальных условиях, что ограничивает возможности материаловедения и инженерии.
Сложность точного моделирования жидких металлов обусловлена сильными многочастичными взаимодействиями между атомами и необходимостью адекватного описания ближнего порядка в структуре жидкости. В отличие от простых газов, где преобладают взаимодействия между ближайшими соседями, в жидких металлах электроны играют значительную роль в формировании химических связей и коллективного поведения. Это требует учета сложных электронных эффектов и корреляций, что значительно усложняет расчеты. Более того, жидкие металлы демонстрируют выраженный ближний порядок — локальные упорядоченные структуры, которые влияют на их физические свойства и динамику. Адекватное воспроизведение этого ближнего порядка в моделировании требует использования сложных потенциалов или методов, учитывающих электронную структуру, что представляет собой серьезную вычислительную задачу. Пренебрежение этими факторами приводит к неверному описанию диффузии, фазовых переходов и других важных явлений.
Ограничения в вычислительных ресурсах существенно замедляют прогресс в области разработки и оптимизации материалов с заданными свойствами. Трудности в моделировании жидких металлов, обусловленные сложностью межчастичных взаимодействий, не позволяют эффективно исследовать влияние структуры на ключевые характеристики, такие как прочность, теплопроводность и коррозионная стойкость. Это препятствует созданию новых сплавов с улучшенными эксплуатационными качествами для различных отраслей промышленности, от авиакосмической до энергетики. Невозможность предсказывать поведение материалов на атомном уровне без значительных вычислительных затрат вынуждает ученых прибегать к дорогостоящим и трудоемким экспериментальным методам, замедляя тем самым инновационный процесс и ограничивая возможности для создания материалов будущего.

Машинное обучение потенциалов: путь к эффективности
Машинное обучение межatomных потенциалов (MLP) представляет собой перспективную альтернативу традиционным методам, основанную на обучении потенциальной поверхности взаимодействия атомов с использованием высокоточных расчетов из первых принципов, таких как теория функционала плотности (DFT). Вместо непосредственного вычисления энергии системы для каждой конфигурации атомов, MLP модели учатся аппроксимировать эту энергию на основе ограниченного набора данных, полученных из расчетов ab initio. Это позволяет значительно сократить вычислительные затраты при проведении молекулярно-динамических симуляций, поскольку энергия системы определяется гораздо быстрее, чем при прямом расчете. Фактически, MLP модели позволяют представлять потенциальную энергию в виде функции от координат атомов, что значительно ускоряет процесс определения сил, действующих на атомы, и, следовательно, эволюцию системы во времени.
Использование машинного обучения для создания межатомных потенциалов позволяет значительно ускорить молекулярно-динамические симуляции. Традиционные методы расчета сил между атомами являются вычислительно затратными, ограничивая возможность моделирования систем большого размера или длительных временных интервалов. Внедрение ML-потенциалов, обученных на данных высокоточных расчетов, сокращает время, необходимое для вычисления сил, что позволяет моделировать системы, содержащие миллионы атомов, и исследовать динамику процессов на наносекундных и даже микросекундных временных масштабах. Это открывает возможности для изучения сложных явлений, таких как диффузия, фазовые переходы и химические реакции, которые ранее были недоступны для моделирования.
Точность машинного обучения межатомных потенциалов (MLP) напрямую зависит от качества и репрезентативности данных, используемых для обучения. Недостаточное количество данных или их неполное описание могут привести к неточным предсказаниям энергии и сил, что негативно скажется на результатах молекулярно-динамических симуляций. Важно, чтобы обучающая выборка охватывала широкий спектр конфигураций, включая различные фазы вещества, дефекты и температуры, чтобы MLP могло адекватно аппроксимировать потенциальную энергию системы в различных условиях. Некорректные или нерепрезентативные данные приводят к систематическим ошибкам и ограничению области применимости полученного потенциала.
Обучение моделей межатомных потенциалов машинного обучения исключительно на кристаллических структурах является недостаточным для точного моделирования жидкостей. Это связано с тем, что жидкостное состояние характеризуется отсутствием дальнего порядка и значительным разнообразием локальных структурных конфигураций, которые не представлены в кристаллических данных. В результате, MLP, обученные только на кристаллах, могут демонстрировать значительные ошибки при предсказании энергии и сил в жидкостях, что приводит к неверному моделированию динамики и свойств жидких систем. Для получения адекватных результатов необходимо включать в обучающую выборку данные, репрезентативные для различных состояний жидкости, включая аморфные структуры и конфигурации с различной плотностью и температурой.

Метод синтетических жидкостей: расширение горизонтов
Метод Synthetic Liquid Training заключается в систематическом искажении эталонной гранецентрированной кубической (ГЦК) структуры. Данный процесс включает в себя внесение контролируемых возмущений в положения атомов, что позволяет создать разнообразный набор конфигураций, имитирующих жидкоподобное состояние вещества. ГЦК структура служит исходной точкой, поскольку она представляет собой распространенную кристаллическую структуру металлов, и её деформация позволяет получить данные, отражающие переход в жидкую фазу. Количество и характер возмущений варьируются для генерации набора данных, охватывающего широкий спектр возможных жидких конфигураций, необходимых для обучения модели машинного обучения.
Использование известных характеристик жидких металлов, в частности, короткодействующего порядка, позволяет повысить точность предсказания энергий и сил в жидком состоянии при использовании многослойного персептрона (MLP). Короткодействующий порядок описывает корреляции между атомами на небольших расстояниях, сохраняющиеся даже в отсутствие дальнего порядка, характерного для кристаллических структур. Включение в обучающую выборку данных, отражающих эти локальные корреляции, улучшает способность MLP к обобщению и прогнозированию свойств жидких металлов, поскольку модель обучается распознавать и учитывать влияние ближайшего окружения атомов на их энергетическое состояние и взаимодействие.
Использование синтетических данных, полученных методом Synthetic Liquid Training, позволяет значительно расширить обучающую выборку за пределы традиционных данных о кристаллических структурах. Это расширение критически важно для повышения способности многослойного персептрона (MLP) к обобщению и точному прогнозированию энергетических и силовых характеристик в жидком состоянии вещества. Ограничение обучения только кристаллическими данными приводит к недостаточной точности при моделировании жидкостей из-за существенных различий в атомной структуре и взаимодействиях. Увеличение разнообразия данных за счет моделирования различных жидких конфигураций позволяет MLP лучше адаптироваться к новым, ранее не встречавшимся структурам и повысить надежность предсказаний.
Для повышения точности модели машинного обучения (MLP) в процессе обучения применялись расчеты, выполненные с использованием как функционала Пердева-Бёрка-Эрнзерхофа (PBE), так и функционала r2SCAN. Использование двух различных функционалов плотности позволило расширить разнообразие обучающих данных и учесть различные аспекты электронного строения исследуемых систем. PBE является широко используемым функционалом общего назначения, в то время как r2SCAN представляет собой мета-GGA функционал, который часто обеспечивает повышенную точность, особенно для систем с сильной корреляцией. Комбинация этих двух функционалов позволила улучшить обобщающую способность MLP и повысить точность предсказания энергий и сил в исследуемых материалах.

Проверка и влияние: расширение возможностей моделирования
Исследования показали, что многослойные персептроны (MLP), обученные на синтетических данных о жидких металлах, демонстрируют высокую точность в воспроизведении ключевых свойств, таких как плотность и диффузионная способность. В ходе работы была показана способность моделей достоверно предсказывать поведение жидких металлов, что подтверждается соответствием расчетных данных известным экспериментальным результатам. Особенностью подхода является возможность получения данных для обучения, не требующих дорогостоящих и трудоемких расчетов методом молекулярной динамики ab initio (AIMD), что значительно расширяет возможности моделирования и анализа свойств жидких металлов в различных условиях.
Для повышения точности модели машинного обучения, основанной на многослойном персептроне (MLP), была успешно применена методика расширения атомных кластеров (ACE Potential). Интеграция ACE Potential позволила значительно уточнить описание межчастичного взаимодействия в жидком металле, что привело к более реалистичному моделированию его свойств. Эта комбинация позволила не только улучшить предсказательную способность MLP по таким параметрам, как плотность и диффузия, но и повысить стабильность симуляций, особенно при увеличении размера моделируемой системы. В результате, стало возможным исследовать более длительные временные интервалы и большие системы, что ранее было недоступно при использовании методов молекулярной динамики, основанных на первом принципе (AIMD).
Разработанные модели машинного обучения продемонстрировали значительное повышение стабильности при проведении симуляций, что позволило исследовать временные масштабы и размеры систем, недоступные для традиционных методов молекулярной динамики, основанных на принципах первого принципа (AIMD). В отличие от моделей, обученных на данных AIMD, которые демонстрируют неустойчивость при увеличении размера моделируемой системы, представленные модели обеспечивают стабильные траектории моделирования во всем диапазоне температур и размеров систем. Это существенное улучшение открывает возможности для изучения сложных процессов в жидких металлах с беспрецедентной точностью и масштабом, что является важным шагом на пути к разработке новых материалов.
Для обеспечения воспроизводимости исследований и ускорения открытия новых материалов, разработанные модели машинного обучения (MLP) и соответствующие наборы данных находятся в открытом доступе на платформе ColabFit Exchange. Данный шаг позволяет исследователям по всему миру не только проверить и повторить полученные результаты, но и использовать эти модели в качестве отправной точки для собственных разработок. Открытый доступ к данным и моделям способствует коллективному прогрессу в области материаловедения, позволяя избежать дублирования усилий и стимулируя инновации, основанные на уже проверенных и валидированных результатах. Это особенно важно для сложных систем, где получение экспериментальных данных является трудоемким и дорогостоящим процессом.
Полученные модели машинного обучения демонстрируют высокую степень соответствия экспериментальным данным по температуре плавления, с погрешностью в диапазоне от -6% до 1%. Прогнозируемые значения плотности и коэффициента диффузии жидких металлов не только согласуются с имеющимися экспериментальными данными, но и сопоставимы по воспроизводимости с самими экспериментальными измерениями. Такая точность позволяет надежно моделировать поведение жидких металлов в широком диапазоне температур и размеров систем, что открывает возможности для изучения сложных материалов и процессов, ранее недоступных из-за вычислительных ограничений традиционных методов.
Исследование, представленное в данной работе, демонстрирует стремление к очищению и упрощению сложных процессов моделирования жидких металлов. Создание стабильных потенциалов взаимодействия посредством инженерного подхода к наборам данных — это отказ от избыточности, присущей традиционным методам, требующим огромных вычислительных затрат. Как заметила Симона де Бовуар: «Не существует ничего, кроме бесконечного круга возможности, и человек, чтобы освободиться, должен сам эту возможность создать». Подобно этому, исследователи создают возможность точного моделирования, очищая данные от шума и концентрируясь на физически обоснованных параметрах, что позволяет выйти за рамки ограничений, накладываемых вычислительной сложностью. Цель — не добавить новые факторы, а убрать лишнее, чтобы суть модели стала очевидной.
Что дальше?
Представленная работа, хоть и демонстрирует эффективность тщательно спроектированных наборов данных для обучения межatomных потенциалов, не решает проблему в корне. Попытки “приручить” сложность жидких металлов через машинное обучение неизбежно сталкиваются с вопросом: насколько адекватно эти потенциалы отражают истинную физику, особенно в условиях, далеких от тренировочного набора? Простота — вот что действительно необходимо. Уменьшение зависимости от огромных объемов данных ab initio, и переход к потенциалам, основанным на фундаментальных физических принципах, — вот куда следует двигаться.
Особое внимание заслуживает вопрос о краткодействующих корреляциях и локальном порядке. Игнорирование этих эффектов в пользу глобальной “гладкости” потенциала — это все равно что пытаться нарисовать океан, не учитывая волны. Необходимы методы, позволяющие эффективно кодировать информацию о локальном окружении атомов, не увеличивая при этом вычислительную сложность. Краткость — сестра таланта, и в данном случае — сестра точности.
В конечном счете, истинный прогресс лежит не в создании все более сложных моделей, а в понимании того, что можно отбросить. Настоящая элегантность — это не изобилие деталей, а ясность основных принципов. Пусть будущее молекулярных динамических симуляций жидких металлов будет основано на простоте, а не на сложности — на фундаментальной физике, а не на статистической ловкости.
Оригинал статьи: https://arxiv.org/pdf/2601.05003.pdf
Связаться с автором: https://www.linkedin.com/in/avetisyan/
Смотрите также:
- Восполняя пробелы в знаниях: Как языковые модели учатся делать выводы
- Квантовый Монте-Карло: Моделирование рождения электрон-позитронных пар
- Эмоциональный отпечаток: Как мы научили ИИ читать душу (и почему рейтинги вам врут)
- Виртуальная примерка без границ: EVTAR учится у образов
- Насколько важна полнота при оценке поиска?
- Переключение намагниченности в квантовых антиферромагнетиках: новые горизонты для терагерцовой спинтроники
- Геометрия на пределе: как алгоритмы оптимизации превосходят языковые модели
- Оптимизация партийных запросов: Метод имитации отжига против градиентных подходов
- Квантовый скачок из Андхра-Прадеш: что это значит?
- Скрытая сложность: Необратимые преобразования в квантовых схемах
2026-01-11 10:43