Сохраняя геометрию: Квантование для эффективных 3D-моделей

Автор: Денис Аветисян

Новый подход позволяет значительно сжать нейронные сети, сохраняя при этом точность и физическую достоверность при моделировании молекулярной динамики.

Предлагаемая схема квантования с учётом эквивариантности разделяет эквивариантные векторы на величину и направление, применяет ступенчатый график обучения для инвариантных и эквивариантных признаков и стабилизирует скалярные произведения посредством нормализации <span class="katex-eq" data-katex-display="false">\ell\_2</span> и температурной шкалы, что обеспечивает ускорение вычислений в 2.37-2.73 раза и снижение объема памяти примерно в 4 раза при крайне низкой погрешности эквивариантности (LEE ≈ 0.15). — Предлагаемая схема квантования с учётом эквивариантности разделяет эквивариантные векторы на величину и направление, применяет ступенчатый график обучения для инвариантных и эквивариантных признаков и стабилизирует скалярные произведения посредством нормализации $\ell\_2$ и температурной шкалы, что обеспечивает ускорение вычислений в 2.37-2.73 раза и снижение объема памяти примерно в 4 раза при крайне низкой погрешности эквивариантности (LEE ≈ 0.15).

Разработана структура геометрически-адаптированного квантования, обеспечивающая высокую степень сжатия (до 4 бит) для SO(3)-эквивариантных графовых нейронных сетей.

Сохранение физической состоятельности в задачах моделирования молекулярных систем часто сталкивается с ограничениями вычислительных ресурсов и объема памяти. В данной работе, посвященной теме ‘Preserving Continuous Symmetry in Discrete Spaces: Geometric-Aware Quantization for SO(3)-Equivariant GNNs’, предложен новый подход к квантованию $SO(3)$ -эквивариантных графовых нейронных сетей, позволяющий значительно снизить вычислительные затраты без потери точности и сохранения физических законов. Ключевым результатом является разработка фреймворка геометрически-осведомленного квантования, достигающего сжатия до 4 бит весов при сохранении высокой точности моделирования динамики молекул. Не откроет ли это путь к созданию более эффективных и доступных инструментов для моделирования сложных материалов и химических процессов?

Вызов Эквивариантности в Современных Нейросетях

Современные молекулярные симуляции и предсказание свойств материалов всё чаще опираются на графовые нейронные сети, обладающие эквивариантностью к вращениям — SO3-эквивариантные GNN, такие как NequIP и So3krates. Эти сети способны учитывать симметрию молекулярных структур, что существенно повышает точность предсказаний, особенно при моделировании сложных химических реакций и свойств новых материалов. В отличие от традиционных нейронных сетей, не учитывающих вращения и трансляции, SO3-эквивариантные модели позволяют получать более физически обоснованные и надежные результаты, что делает их незаменимыми инструментами в области вычислительной химии, материаловедения и фармацевтики. Их применение позволяет сократить вычислительные затраты и время, необходимое для разработки новых лекарств и материалов с заданными свойствами.

Несмотря на значительный прогресс в разработке SO3-эквивариантных графовых нейронных сетей, таких как NequIP и So3krates, их широкое внедрение в практику сталкивается с существенными трудностями. Эти мощные модели требуют значительных объемов памяти и вычислительных ресурсов, что ограничивает их применение на оборудовании с ограниченными возможностями и затрудняет проведение масштабных симуляций. Высокие требования к ресурсам не только увеличивают стоимость исследований, но и создают препятствия для использования этих методов в реальных приложениях, где важны скорость и эффективность, например, при разработке новых материалов или лекарственных препаратов. Таким образом, потребность в оптимизации и снижении вычислительной нагрузки становится ключевым фактором для раскрытия полного потенциала этих перспективных моделей.

Снижение разрядности представления данных в моделях, известное как LowBitQuantization, представляет собой перспективный путь к повышению эффективности и снижению вычислительных затрат. Однако, этот подход сопряжен с риском нарушения фундаментального свойства, известного как эквивариантность. Эквивариантность гарантирует, что предсказания модели остаются согласованными при вращениях и других симметриях входных данных, что критически важно для точного моделирования молекулярных систем. Нарушение эквивариантности в SO(3)-эквивариантных графовых нейронных сетях, таких как NequIP и So3krates, может привести к значительным ошибкам в предсказаниях свойств молекул и снизить надежность симуляций, что делает поддержание этого свойства ключевой задачей при реализации методов квантования.

Архитектура обрабатывает входные данные <span class="katex-eq" data-katex-display="false">ZZ</span> и <span class="katex-eq" data-katex-display="false">𝐫</span> по раздельным инвариантным и эквивариантным путям, используя различные стратегии квантизации (линейную и MDDQ) для каждой ветви. — Архитектура обрабатывает входные данные $ZZ$ и $𝐫$ по раздельным инвариантным и эквивариантным путям, используя различные стратегии квантизации (линейную и MDDQ) для каждой ветви.

Разделение Величины и Направления: Новая Стратегия Квантования

Квантование с разделением величины и направления (Magnitude-Direction Decoupled Quantization) решает проблему потери точности путем разложения трехмерных векторов на инвариантную величину и эквивариантное направление. Такое разделение позволяет независимо квантовать каждый компонент, что существенно снижает сложность и повышает эффективность сжатия. По сути, вектор $\vec{x}$ представляется как произведение скалярной величины $||\vec{x}||$ и единичного вектора направления $\hat{x}$ . Независимое квантование величины и направления позволяет оптимизировать процесс сжатия, сохраняя при этом важные характеристики вектора.

Для эффективного представления направляющей компоненты в методе раздельной квантизации величины и направления используется Сферический Кодовый Книги (SphericalCodebook). Этот подход основан на создании набора кодовых векторов, равномерно распределенных на единичной сфере, что позволяет представить любой вектор направления с использованием ближайшего кодового вектора. Ключевым свойством Сферического Кодового Книги является сохранение вращательной симметрии: вращение входного вектора направления приводит к соответствующему вращению выбранного кодового вектора, не изменяя индекс в кодовом книге. Это свойство обеспечивает инвариантность к вращениям и способствует более стабильной и точной работе алгоритма квантизации, особенно при низких разрядностях.

Разделение вектора на инвариантную величину и эквивариентное направление позволяет схеме квантования эффективно функционировать при низких разрядностях. Традиционные методы квантования, оперирующие непосредственно с 3D-векторами, испытывают значительную потерю точности при уменьшении числа бит, используемых для представления каждого компонента. В данной стратегии, независимая квантизация величины и направления позволяет снизить чувствительность к ошибкам округления, поскольку ошибки, возникающие при квантовании одного компонента, не оказывают существенного влияния на другой. Это особенно важно для моделей, требующих высокой точности представления векторов, таких как нейронные сети, где даже небольшие ошибки могут накапливаться и приводить к снижению производительности. Использование меньшего количества бит для представления каждого компонента снижает потребление памяти и вычислительные затраты, сохраняя при этом приемлемый уровень точности.

Геометрическая Согласованность посредством Оптимизированного Обучения

Непосредственная оптимизация квантованных моделей на многообразиях, таких как сфера, сталкивается с трудностями из-за неевклидовой геометрии. В отличие от евклидовых пространств, где стандартные методы градиентного спуска применимы напрямую, на многообразиях понятие «прямой линии» и, следовательно, градиентного спуска, требует переопределения. Традиционные методы оптимизации предполагают, что пространство параметров является плоским, что не соответствует геометрии сферы или других неевклидовых многообразий. Это приводит к неточным оценкам градиента и, как следствие, к неэффективной или нестабильной сходимости алгоритма обучения. Например, в $ℝⁿ$ пространство касательных плоскостей является плоским, но на сфере касательные плоскости сами являются сферами, что требует использования специализированных методов для определения направления обновления параметров.

Риманова оптимизация предоставляет теоретическую базу для оптимизации моделей на многообразиях, таких как сфера, однако её практическое применение требует эффективной оценки градиентов. В отличие от стандартной оптимизации в евклидовом пространстве, где градиенты могут быть вычислены напрямую, на многообразиях необходимо учитывать кривизну и геометрию пространства. Вычисление точных градиентов часто не представляется возможным или является вычислительно дорогостоящим. Следовательно, для успешного применения римановой оптимизации необходимы методы приближенного вычисления градиентов, обеспечивающие достаточную точность и скорость сходимости. Точность оценки градиента напрямую влияет на качество обучения и требует баланса между вычислительными затратами и производительностью модели.

Геометрический прямой оценщик (Geometric Straight-Through Estimator, GSTE) обеспечивает геометрически согласованные обновления параметров во время обучения квантованных моделей. В отличие от стандартных методов обратного распространения ошибки, которые могут игнорировать недифференцируемость операции квантизации, GSTE аппроксимирует градиент через квантованный слой, используя информацию о геометрии пространства параметров. Это позволяет градиенту «проходить сквозь» квантованный слой, сохраняя при этом информацию о направлении наиболее быстрого спуска в исходном непрерывном пространстве. Такой подход минимизирует искажения градиента, вызванные квантизацией, и способствует более эффективному обучению, особенно при низких разрядностях, где влияние квантизации наиболее заметно. Фактически, GSTE обеспечивает согласованность между обучением в непрерывном пространстве и дискретном квантованном пространстве, что приводит к повышению точности и стабильности модели.

Метод AttentionNormalization стабилизирует модель в процессе квантизации, предотвращая снижение производительности при низкой точности. Он достигается за счет нормализации весов внимания, что позволяет поддерживать градиенты в более стабильном диапазоне во время обучения. Это особенно важно при использовании низкоточных форматов данных, таких как int8 или даже меньше, где квантизация может приводить к значительной потере информации и нестабильности обучения. Внедрение AttentionNormalization позволяет уменьшить влияние квантизации на градиенты и, следовательно, улучшить общую производительность модели после квантизации, сохраняя или даже улучшая точность по сравнению с базовой моделью без нормализации.

Преодоление «Стены Памяти»: Влияние и Перспективы

Метод раздельной квантизации величины и направления значительно снижает объем занимаемой памяти и ускоряет вычисления, эффективно преодолевая ограничения, накладываемые так называемой «Стенкой памяти» ( $MemoryWall$ ). Вместо стандартного представления параметров модели в виде чисел с плавающей точкой, данный подход разделяет информацию о величине и направлении каждого параметра, позволяя квантовать их независимо. Это приводит к значительному сокращению битовой точности, необходимой для хранения параметров, и, как следствие, к уменьшению потребляемой памяти и ускорению операций, поскольку для обработки квантованных данных требуются менее ресурсоемкие вычисления. Такое разделение особенно эффективно в контексте S\O(3)-эквивариантных графовых нейронных сетей, где сохранение симметрии играет ключевую роль, и позволяет добиться существенного прогресса в развертывании этих моделей на устройствах с ограниченными ресурсами.

Разработанная методика квантования позволяет внедрять SO3-эквивариантные графовые нейронные сети (GNN) на устройствах с ограниченными вычислительными ресурсами, значительно расширяя спектр решаемых задач. Ранее требовавшие мощных серверов для обработки, эти сети теперь могут быть развернуты на мобильных устройствах, встроенных системах и других платформах с ограниченной памятью и энергопотреблением. Это открывает возможности для проведения молекулярного моделирования и анализа данных непосредственно на месте, например, в полевых условиях или в рамках оперативных исследований, что ранее было практически невозможно. Возможность локальной обработки данных снижает зависимость от облачных вычислений и обеспечивает повышенную конфиденциальность, а также позволяет решать задачи, требующие высокой скорости реакции и минимальной задержки.

Предложенный подход к квантованию демонстрирует значительное повышение эффективности S\O(3)-эквивариантных графовых нейронных сетей (GNN). Экспериментальные результаты показывают ускорение вычислений в 2.39 раза и сокращение объема используемой памяти в 4 раза. При этом, достигается сохранение почти идеальной эквивариантности, подтвержденное низким значением ошибки LEE — всего 0.15 меВ/Å. Данные показатели позволяют реализовать сложные модели на устройствах с ограниченными ресурсами, открывая новые возможности для применения в различных областях науки и техники, где требуется эффективная обработка данных, обладающих симметрией.

Квантованная модель демонстрирует значительное повышение точности предсказания энергии, достигая средней абсолютной ошибки $MAE$ в 9.31 меВ. Этот результат существенно превосходит показатели базовой модели, использующей 32-битную точность с плавающей точкой (FP32), у которой $MAE$ составляет 23.20 меВ. Такое существенное улучшение свидетельствует о том, что предлагаемый метод квантования не только эффективно снижает потребление памяти и ускоряет вычисления, но и позволяет получить более точные результаты в задачах молекулярного моделирования, открывая новые возможности для научных исследований и разработок.

Несмотря на успешное подавление нарушения симметрии, возникающего при квантовании, дальнейшие исследования могут быть направлены на разработку адаптивных стратегий квантования. Такой подход позволит динамически регулировать точность представления параметров в зависимости от их значимости для модели. Вместо использования единой точности для всех весов, система будет автоматически определять, какие параметры требуют высокой точности для сохранения необходимой производительности и точности результатов, а какие могут быть представлены с меньшей точностью, что приведет к еще большему снижению требований к памяти и ускорению вычислений. Это может включать в себя анализ чувствительности модели к изменениям отдельных параметров или использование методов машинного обучения для определения оптимального уровня квантования для каждого параметра, открывая путь к созданию более эффективных и специализированных $SO(3)$ -эквивариантных графовых нейронных сетей.

Достижения в области квантования и снижения требований к памяти открывают новые возможности для проведения более эффективных и масштабируемых молекулярных симуляций. Уменьшение вычислительной нагрузки и объема необходимой памяти позволяет исследовать более сложные молекулярные системы и проводить симуляции большей продолжительности, что критически важно для ускорения научных открытий в химии, материаловедении и биологии. Возможность развертывания $SO(3)$ -эквивариантных графовых нейронных сетей (GNN) на устройствах с ограниченными ресурсами значительно расширяет спектр решаемых задач, позволяя проводить анализ и моделирование непосредственно на месте, без необходимости использования мощных вычислительных кластеров. Такой прогресс не только повышает эффективность исследований, но и способствует разработке новых материалов и лекарственных препаратов с заданными свойствами, что в конечном итоге оказывает значительное влияние на различные области науки и техники.

Модель Naive INT8 демонстрирует катастрофическую расходимость энергии в динамике NVE, в то время как наша модель W4A8 сохраняет стабильность, сравнимую с базовой FP32, подтверждая корректность физической динамики и отсутствие долгосрочного дрейфа (менее 0.15 <span class="katex-eq" data-katex-display="false">meV/atom/ps</span>). — Модель Naive INT8 демонстрирует катастрофическую расходимость энергии в динамике NVE, в то время как наша модель W4A8 сохраняет стабильность, сравнимую с базовой FP32, подтверждая корректность физической динамики и отсутствие долгосрочного дрейфа (менее 0.15 $meV/atom/ps$ ).

Представленная работа демонстрирует, что стремление к сохранению непрерывности симметрии в дискретном пространстве — это не просто математическая утонченность, но и практическая необходимость для достижения эффективности в сложных симуляциях, таких как молекулярная динамика. Архитектура, стремящаяся к низкобитной точности, подобна попытке запечатлеть текучесть системы в статичном кадре. Как отмечал Пол Эрдёш: «Каждая математическая задача — это окно в другой мир». В данном случае, это окно открывает возможности для преодоления узких мест памяти, позволяя создавать более масштабные и точные модели, где каждый выбор архитектуры — это своего рода пророчество о будущих сбоях и компромиссах.

Что Дальше?

Представленный подход, несомненно, смягчает неминуемый кризис памяти, но не решает его. Сжатие весов до 4 бит — это лишь отсрочка, а не избавление. В каждом таком решении скрыт страх перед энтропией, иллюзия контроля над растущей сложностью систем. Следующим этапом станет не столько поиск более эффективных алгоритмов квантования, сколько признание неизбежности потерь и разработка методов их контролируемого распространения.

Упор на SO(3)-эквивариантность, безусловно, оправдан в контексте молекулярной динамики, однако он же накладывает ограничения. Архитектура, привязанная к конкретной группе симметрий, рано или поздно столкнется с данными, нарушающими эти ограничения. Надежда на идеальную архитектуру — это форма отрицания энтропии. Вероятно, будущее за адаптивными системами, способными динамически переоценивать и перестраивать свои симметрии в ответ на входящие данные.

Этот паттерн выродится через три релиза. Вполне возможно, что ключевым станет не столько оптимизация существующих сетей, сколько переход к принципиально новым парадигмам представления данных — к системам, где сама концепция “веса” станет архаизмом. Подобно тому, как квантовая механика отказалась от классических представлений о траекториях, так и машинное обучение рано или поздно столкнется с необходимостью отказа от дискретных параметров.

Оригинал статьи: https://arxiv.org/pdf/2603.05343.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-03-08 08:18

🚀 Квантовые новости