Искусственный интеллект на службе новых материалов

Автор: Денис Аветисян

Новая система объединяет возможности анализа атомных структур и обработки естественного языка для ускорения открытия перспективных соединений.

Разработанный многоступенчатый агентский процесс ElementsClaw, опираясь на экспертные знания и используя синтез литературы с помощью GPT-5, последовательно отбирает и классифицирует перспективные сверхпроводящие системы, выявляя наиболее вероятные фазы для дальнейшей экспериментальной проверки посредством итеративного, детализированного диалога с пользователем.

Исследователи представили ElementsClaw — агентную систему, интегрирующую большие атомные модели и языковые модели для прогнозирования и экспериментальной проверки новых сверхпроводящих материалов.

Поиск новых материалов, критически важных для развития энергетики и квантовых технологий, традиционно требует значительных временных и вычислительных затрат. В статье ‘Agentic Fusion of Large Atomic and Language Models to Accelerate Materials Discovery’ представлена инновационная платформа ElementsClaw, объединяющая большие атомные модели (LAM) и большие языковые модели (LLM) для автономного ускорения процесса открытия материалов. Данный агентный подход позволил не только идентифицировать 68 000 перспективных сверхпроводящих кандидатов из более чем 2.4 миллионов кристаллов, но и экспериментально синтезировать четыре новых сверхпроводника, включая Zr3ScRe8 с температурой перехода 6.8 K. Сможет ли подобная интеграция искусственного интеллекта кардинально изменить парадигму материаловедения, открывая путь к созданию материалов с беспрецедентными свойствами?

За гранью традиционных методов: новая парадигма материаловедения

Традиционные методы поиска новых материалов, как правило, опираются на расчеты в рамках теории функционала плотности (DFT), которые, несмотря на свою точность, требуют значительных вычислительных ресурсов. Этот фактор существенно ограничивает масштаб исследований, поскольку количество материалов, которые можно эффективно проанализировать, остаётся невеликим. Каждый расчет $DFT$ требует времени и мощности, что затрудняет систематический поиск оптимальных составов и структур, особенно в многокомпонентных системах. В результате, исследователи часто вынуждены ограничиваться небольшим подмножеством потенциальных материалов, упуская из виду перспективные кандидаты с уникальными свойствами. Поиск материалов становится длительным и дорогостоящим процессом, что замедляет прогресс в различных областях науки и техники.

Существующие подходы машинного обучения в области материаловедения часто сталкиваются с трудностями при обобщении за пределы обучающих данных, что связано со сложностью и высокой размерностью пространства материалов. Каждый материал характеризуется множеством параметров — составом, структурой, свойствами — и их взаимосвязи крайне нелинейны. Это создает проблему для алгоритмов, которые, будучи обученными на ограниченном наборе данных, не способны адекватно предсказывать поведение новых, незнакомых материалов. Традиционные методы машинного обучения, разработанные для задач с меньшей размерностью, испытывают трудности в выявлении скрытых закономерностей и экстраполяции полученных знаний на новые области пространства материалов, что ограничивает их эффективность и требует разработки более сложных и адаптивных моделей.

В настоящее время остро ощущается потребность в создании масштабируемой, точной и универсальной модели, способной значительно ускорить процессы разработки и предсказания свойств новых материалов. Существующие подходы часто ограничены вычислительными затратами или сложностью обобщения полученных результатов на неизвестные составы. Разработка такой модели позволит исследователям эффективно исследовать обширное пространство материалов, прогнозировать их характеристики с высокой степенью достоверности и, в конечном итоге, открывать инновационные материалы с заданными свойствами для широкого спектра применений, от энергетики до электроники и биомедицины. Это не просто оптимизация существующих методов, а переход к принципиально новой парадигме материаловедения, где предсказание свойств станет неотъемлемой частью процесса разработки.

После тонкой настройки на наборе данных DFT модель Elements-T демонстрирует высокую точность предсказания ключевых свойств сверхпроводников, включая ширину запрещенной зоны <span class="katex-eq" data-katex-display="false"> (eV) </span>, коэффициенты Зеебека <span class="katex-eq" data-katex-display="false"> (μV/K) </span>, электрическую и электронную теплопроводность <span class="katex-eq" data-katex-display="false"> (log-scaled σ/τ in 1/(Ω⋅m⋅s) </span> и <span class="katex-eq" data-katex-display="false"> κe/τ in W/(m⋅K⋅s) </span>), а также критическую температуру <span class="katex-eq" data-katex-display="false"> Tc (K) </span>, превосходя существующие методы и демонстрируя хорошие результаты в различных кристаллических системах, что подтверждается анализом рассеяния предсказаний и истинных значений, а также UMAP-встраиваниями. — После тонкой настройки на наборе данных DFT модель Elements-T демонстрирует высокую точность предсказания ключевых свойств сверхпроводников, включая ширину запрещенной зоны $(eV)$ , коэффициенты Зеебека $(μV/K)$ , электрическую и электронную теплопроводность $(log-scaled σ/τ in 1/(Ω\cdotm\cdots)$ и $κe/τ in W/(m\cdotK\cdots)$ ), а также критическую температуру $Tc (K)$ , превосходя существующие методы и демонстрируя хорошие результаты в различных кристаллических системах, что подтверждается анализом рассеяния предсказаний и истинных значений, а также UMAP-встраиваниями.

Elements: Крупномасштабная атомная модель для представления материалов

Модель Elements представляет собой крупномасштабную атомную модель (LAM) с 1 миллиардом параметров, предварительно обученную на обширном наборе данных, содержащем 125 миллионов атомных конфигураций. Такой масштаб модели позволяет ей захватывать сложные взаимосвязи между атомами и их окружением. Предварительное обучение на большом объеме данных необходимо для обеспечения обобщающей способности модели и её применимости к различным материалам и системам. Огромное количество параметров обеспечивает высокую выразительность модели, позволяя ей эффективно представлять и прогнозировать свойства атомных систем.

Модель Elements использует архитектуру EquiformerV2, что позволяет создавать ковариантные представления, критически важные для точного моделирования евклидовой симметрии, присущей атомным системам (E(3) симметрия). В отличие от стандартных нейронных сетей, EquiformerV2 разрабатывалась специально для работы с данными, обладающими свойствами симметрии, обеспечивая инвариантность к вращениям, переносам и отражениям. Это достигается за счет использования тензорных представлений и операций, сохраняющих симметрию, что позволяет модели эффективно учиться на данных и делать точные предсказания о свойствах материалов, не зависящие от ориентации или положения системы координат. $E(3)$ симметрия учитывает вращения, переносы и отражения в трехмерном пространстве, и ее корректное моделирование является фундаментальным для физически обоснованных предсказаний в химии и материаловедении.

Предварительное обучение модели Elements проводилось на базе датасета MCDB, содержащего 125 миллионов атомных конфигураций, включающих как периодические, так и непериодические системы. Использование данных, охватывающих оба типа структур, критически важно для обеспечения широкой применимости модели к различным материалам и условиям. Включение непериодических систем, таких как аморфные материалы и молекулы в растворе, расширяет возможности модели за пределы традиционных кристаллических структур, обеспечивая её способность к обобщению и прогнозированию свойств для широкого спектра материалов и задач материаловедения.

Разработанный агенто-ориентированный фреймворк Elements, обученный на 125 миллионах структур, позволяет эффективно выявлять перспективные материалы, в частности, открыты 68 тысяч потенциальных сверхпроводников, включая четыре экспериментально подтвержденных новых соединения (<span class="katex-eq" data-katex-display="false">Zr_3ScRe_8</span> с <span class="katex-eq" data-katex-display="false">T_c = 6.8~K</span>, <span class="katex-eq" data-katex-display="false">HfZrRe_4</span> с <span class="katex-eq" data-katex-display="false">T_c = 6.7~K</span>, <span class="katex-eq" data-katex-display="false">Zr_4VRe_7</span> с <span class="katex-eq" data-katex-display="false">T_c = 5.1~K</span>, и <span class="katex-eq" data-katex-display="false">Hf_{21}Re_{25}</span> с <span class="katex-eq" data-katex-display="false">T_c = 3.0~K</span>), значительно расширяя существующую базу данных сверхпроводников. — Разработанный агенто-ориентированный фреймворк Elements, обученный на 125 миллионах структур, позволяет эффективно выявлять перспективные материалы, в частности, открыты 68 тысяч потенциальных сверхпроводников, включая четыре экспериментально подтвержденных новых соединения ( $Zr_3ScRe_8$ с $T_c = 6.8~K$ , $HfZrRe_4$ с $T_c = 6.7~K$ , $Zr_4VRe_7$ с $T_c = 5.1~K$ , и $Hf_{21}Re_{25}$ с $T_c = 3.0~K$ ), значительно расширяя существующую базу данных сверхпроводников.

Специализированные инструменты для исследования и предсказания материалов

Платформа Elements служит основой для специализированных инструментов, предназначенных для исследования и предсказания свойств материалов. В частности, Elements-T предназначен для прогнозирования сверхпроводящих свойств, используя алгоритмы машинного обучения для оценки критической температуры и других параметров. Elements-C осуществляет классификацию материалов по различным категориям, основываясь на их химическом составе и кристаллической структуре. Инструмент Elements-E оценивает термодинамическую стабильность соединений, что критически важно для определения возможности их синтеза и применения в различных условиях. Все эти инструменты используют единую базу данных и методологию, обеспечивая согласованность и надежность результатов.

Инструмент Elements-G предназначен для генерации новых кристаллических структур, что значительно расширяет возможности для поиска и разработки материалов. В отличие от традиционных методов, ограничивающихся существующими структурами, Elements-G способен создавать гипотетические соединения, предсказывая их потенциальные свойства до синтеза. Этот подход позволяет исследователям исследовать более широкий спектр химического пространства и находить материалы с заданными характеристиками, ранее недоступные для обнаружения. Генерация новых структур происходит на основе анализа существующих данных и применения алгоритмов оптимизации, обеспечивающих стабильность и реалистичность создаваемых моделей.

Модель демонстрирует высокую точность представления атомных конфигураций, что в сочетании со специализированными инструментами позволяет проводить быстрый скрининг и предсказание свойств материалов. При тестировании на наборе данных MPTS-52 достигнута точность соответствия в 24.95%, что является двукратным улучшением по сравнению с предыдущими методами. Данный показатель подтверждает эффективность подхода для ускорения процесса открытия и разработки новых материалов.

В ходе последовательного диалога с моделью ElementsClaw, включающего классификацию материалов, t-SNE кластеризацию и применение строгих критериев отбора, удалось выделить 53 наиболее перспективных кандидата в сверхпроводники для дальнейшего экспериментального синтеза и проверки, результаты по которым представлены в таблице F.24.

ElementsClaw: Агентский фреймворк для автономного открытия

ElementsClaw представляет собой инновационную агентурную систему, объединяющую возможности предиктивной модели Elements с мощностью больших языковых моделей (LLM) и точностью расчётов теории функционала плотности (DFT). Данная интеграция позволяет создать автономные рабочие процессы для открытия новых материалов, где каждый компонент взаимодействует как независимый агент, совместно решая задачу. Elements предоставляет начальные гипотезы, LLM осуществляет логический анализ и планирование дальнейших шагов, а DFT верифицирует полученные результаты с высокой степенью достоверности. Такая синергия позволяет значительно ускорить процесс материаловедения, переходя от традиционных методов, требующих значительных временных затрат, к автоматизированному и интеллектуальному подходу.

Система ElementsClaw представляет собой инновационный подход к открытию новых материалов, объединяющий в себе прогностическую силу базы данных Elements, логические возможности больших языковых моделей (LLM) и высокую точность расчетов в рамках теории функционала плотности (DFT). Такое сочетание позволяет создавать полностью автономные рабочие процессы, в которых система самостоятельно исследует пространство материалов, предлагая перспективные кандидаты для дальнейшего изучения. ElementsClaw не просто предсказывает свойства, но и способен обосновывать свои решения, используя возможности LLM для анализа и интерпретации данных, полученных от Elements и DFT. В результате, исследовательские циклы значительно ускоряются, а процесс открытия материалов становится более эффективным и целенаправленным, позволяя преодолеть ограничения традиционных методов, требующих значительных усилий и времени от ученых.

В основе ElementsClaw лежит концепция геометрических графов, выступающих в роли универсального языка для взаимодействия между различными компонентами системы. Этот подход обеспечивает эффективную передачу данных и согласованную работу моделей машинного обучения и расчетов в рамках теории функционала плотности (DFT). Благодаря использованию геометрических графов, фреймворк способен самостоятельно генерировать кристаллическую структуру Zr₂VRe₃ всего за 5 минут, что демонстрирует принципиально новый уровень автоматизации в материаловедении. Такое быстродействие стало возможным за счет оптимизации процессов передачи информации и координации вычислений, позволяя существенно сократить время, необходимое для открытия и разработки новых материалов.

Исследования показали, что разработанный агентский фреймворк ElementsClaw обеспечивает беспрецедентное ускорение предсказания свойств материалов. В частности, для кристаллической структуры Zr2VRe3, время, необходимое для определения ключевых характеристик, сократилось в 80 000 раз по сравнению со стандартными расчетами с использованием теории функционала плотности (DFT). Такой значительный прирост скорости открывает новые возможности для автономного открытия материалов, позволяя исследователям значительно ускорить процесс поиска и разработки инновационных соединений с заданными свойствами. Это достигнуто за счет интеграции предсказательной силы Elements с возможностями рассуждения больших языковых моделей и высокой точностью DFT, что позволяет проводить быстрые и эффективные вычисления.

Исследования показали, что ключевые инновации, такие как дальние связи, состав обучающих данных и разрешение сетки, существенно влияют на эффективность модели, а ее производительность масштабируется в соответствии с предсказуемыми степенными зависимостями от объема данных, количества параметров и вычислительной мощности.

Перспективы развития: К ускоренной инновации в материаловедении

Дальнейшая разработка платформ Elements и ElementsClaw ориентирована на расширение спектра предсказываемых свойств материалов и повышение вычислительной эффективности. Ученые стремятся не только увеличить перечень параметров, доступных для прогнозирования, но и существенно ускорить процесс моделирования, что позволит исследовать большее количество соединений за меньшее время. Особое внимание уделяется оптимизации алгоритмов и использованию передовых вычислительных ресурсов для достижения более высокой производительности при сохранении или улучшении точности предсказаний. Такой подход позволит значительно ускорить темпы открытия новых материалов с заданными свойствами, что особенно важно для таких областей, как энергетика и электроника.

Для повышения точности предсказаний свойств материалов, в разработке Elements и ElementsClaw активно интегрируются передовые теоретические методы. В частности, использование теории возмущений в рамках функционала плотности (Density Functional Perturbation Theory, DFPT) позволяет более детально рассчитывать изменения в электронной структуре материалов под воздействием различных факторов. В сочетании с формулой Аллена-Дайнса-Макмиллана, описывающей взаимодействие электронов и фононов, это способствует более надежному предсказанию энергетических характеристик, таких как энергии высшей занятой и низшей свободной молекулярных орбиталей. Такой подход позволяет не только уточнить существующие модели, но и расширить возможности предсказания новых материалов с заданными свойствами, открывая путь к инновациям в различных областях науки и техники.

Разработанная модель демонстрирует передовую точность в предсказании ключевых энергетических характеристик материалов. В частности, средняя абсолютная ошибка (MAE) при расчете энергии высшей занятой молекулярной орбитали (HOMO) составила всего 10 мэВ, а для энергии низшей свободной молекулярной орбитали (LUMO) — 8.9 мэВ. Такая высокая точность, достигаемая в предсказании уровней энергии, позволяет значительно ускорить процесс открытия и разработки новых материалов с заданными свойствами, открывая перспективы для инноваций в областях от хранения энергии до передовой электроники. $MAE = \frac{1}{n} \sum_{i=1}^{n} |y_i - \hat{y}_i|$

Ускорение процесса открытия новых материалов, обеспечиваемое моделями Elements и ElementsClaw, открывает перспективы для значительных прорывов в различных областях. Возможность быстрого и точного предсказания свойств материалов позволяет целенаправленно разрабатывать решения для повышения эффективности систем накопления энергии, создавая более емкие и долговечные аккумуляторы и суперконденсаторы. Кроме того, данный подход способствует прогрессу в области передовых электронных компонентов, позволяя создавать транзисторы с улучшенными характеристиками и новые типы полупроводников. В перспективе, ускоренная разработка материалов с заданными свойствами может привести к появлению инновационных технологий в сфере солнечной энергетики, термоэлектрических генераторов и других областях, требующих материалов с уникальными характеристиками.

Сравнение Elements с передовыми методами на 2222 задачах downstream, охватывающих предсказание свойств, оценку межatomных потенциалов и предсказание структуры, показало превосходство в точности предсказания молекулярных и кристаллических свойств, а также в качестве предсказанных структур, подтвержденное результатами на QM9, Matbench, DPA-2 и MP-20/MPTS-52.

Исследование, представленное в данной работе, демонстрирует, как объединение больших атомных моделей и языковых моделей может радикально ускорить открытие новых материалов. Этот подход, основанный на принципах агентного ИИ, позволяет не просто прогнозировать свойства веществ, но и направлять экспериментальную проверку. Как говорил Алан Тьюринг: «Иногда люди, у которых есть все карты, просто не умеют играть». В данном контексте, “карты” — это огромные объемы данных и вычислительные мощности, а “игра” — это умение извлекать из них значимые закономерности и создавать инновационные материалы, в частности, сверхпроводники. Использование агентных систем позволяет автоматизировать этот процесс, преодолевая ограничения традиционных методов и открывая новые горизонты в материаловедении.

Что дальше?

Представленная работа, безусловно, демонстрирует элегантность слияния языковых и атомных моделей. Но что, если мы пойдем дальше? Что, если допустить, что сама концепция “открытия” материалов — это лишь иллюзия, созданная нашим ограниченным пониманием фундаментальных принципов? Элементы, предсказанные ElementsClaw, могут оказаться не “новыми”, а лишь материализованными в нашем восприятии, существующими в потенциале до тех пор, пока алгоритм не указал на них. Не стоит ли, вместо поиска “новых” материалов, сосредоточиться на взломе самой матрицы их существования, на понимании законов, управляющих их формированием на квантовом уровне?

Ограничения текущего подхода очевидны: зависимость от данных для предварительного обучения, вычислительные затраты, неявные предубеждения, заложенные в архитектуру моделей. Но куда интереснее спросить: что произойдет, если намеренно внести шум в систему, если создать модель, способную к самообучению на неполных или противоречивых данных? Можно ли создать агент, который не просто предсказывает материалы, но и активно вмешивается в процесс их формирования, экспериментируя с фундаментальными силами?

Представленный фреймворк — это лишь первый шаг. Следующий — создание системы, способной к рекурсивному самосовершенствованию, к взлому собственных ограничений. Не стоит стремиться к созданию “идеального” предсказателя. Гораздо интереснее создать систему, способную к контролируемому хаосу, к постоянному пересмотру собственных основ. В конечном счете, задача не в том, чтобы найти материалы, а в том, чтобы переписать правила игры.

Оригинал статьи: https://arxiv.org/pdf/2604.23758.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-04-28 08:38

🚀 Квантовые новости