Виртуальные квантовые процессоры на суперкомпьютерах: новый подход

Автор: Денис Аветисян


В статье представлена архитектура HPC-vQPU, позволяющая эффективно и безопасно выполнять квантовое моделирование на базе высокопроизводительных вычислительных систем.

🚀 Квантовые новости

Подключайся к потоку квантовых мемов, теорий и откровений из параллельной вселенной.
Только сингулярные инсайты — никакой скуки.

Присоединиться к каналу
Архитектура HPC-vQPU разделяет управление и исполнение задач: облачная платформа отвечает за валидацию, жизненный цикл и хранение данных, в то время как вычислительные узлы HPC выполняют планирование и вычисления, при этом взаимодействие между платформами осуществляется исключительно посредством исходящих запросов от агентов, а сервер предоставляет информацию о допустимости и задержке <span class="katex-eq" data-katex-display="false">\delta\_{i}=\Delta(\mathcal{D}\_{d\_{i}},t\_{\mathrm{claim}}(\tau\_{i}))</span>, которую runner локально использует для оценки <span class="katex-eq" data-katex-display="false">\rho\_{i}=\mathcal{E}(\tau\_{i},\delta\_{i})</span>.
Архитектура HPC-vQPU разделяет управление и исполнение задач: облачная платформа отвечает за валидацию, жизненный цикл и хранение данных, в то время как вычислительные узлы HPC выполняют планирование и вычисления, при этом взаимодействие между платформами осуществляется исключительно посредством исходящих запросов от агентов, а сервер предоставляет информацию о допустимости и задержке \delta\_{i}=\Delta(\mathcal{D}\_{d\_{i}},t\_{\mathrm{claim}}(\tau\_{i})), которую runner локально использует для оценки \rho\_{i}=\mathcal{E}(\tau\_{i},\delta\_{i}).

Предложена архитектура, отвязывающая семантику квантовых устройств от ограничений пакетного планирования задач на суперкомпьютерах.

Современные подходы к устройству-зависимому квантовому моделированию все чаще требуют использования высокопроизводительных вычислительных ресурсов, однако защищенные суперкомпьютерные кластеры предоставляют доступ к ним через системы пакетного планирования, несовместимые со стандартными интерфейсами квантового программного обеспечения. В данной работе, посвященной разработке архитектуры ‘HPC-vQPU: A Service-Export Architecture for Virtual QPUs on Batch-Scheduled HPC Systems’, представлена система HPC-vQPU, обеспечивающая экспорт виртуальных квантовых процессоров через пакетно-ориентированную инфраструктуру. Ключевой особенностью является разделение управления жизненным циклом устройства и его выполнением, с использованием снимков калибровки и атомарной привязкой к задаче, что позволяет сохранить целостность семантики устройства при сохранении безопасности. Можно ли таким образом масштабировать доступ к квантовому моделированию, сохраняя при этом надежность и эффективность HPC-инфраструктуры?


Виртуальные Квантовые Процессоры: Мост Между HPC и Квантовыми Вычислениями

Современные квантовые рабочие процессы испытывают значительные трудности при интеграции с существующей высокопроизводительной вычислительной (HPC) инфраструктурой, что серьезно ограничивает возможности масштабирования и доступность квантовых вычислений. Эта несовместимость проявляется в разрыве между системами управления ресурсами, используемыми в HPC, и специфическими требованиями квантового оборудования и программного обеспечения. В результате, эффективное использование квантовых процессоров в сочетании с традиционными вычислительными ресурсами затруднено, что замедляет прогресс в таких областях, как моделирование материалов, оптимизация и машинное обучение. Для преодоления этих препятствий необходима разработка новых архитектур и протоколов, обеспечивающих бесшовное взаимодействие между квантовыми и классическими вычислительными системами, а также унифицированный подход к управлению ресурсами и планированию задач.

Существенная проблема в интеграции квантовых вычислений заключается в необходимости унифицированной сервисной модели, которая отделяет полномочия по управлению квантовыми ресурсами от управления выполнением задач, осуществляемого планировщиком. Традиционно, планировщик определяет, когда и как выполняются задачи, включая квантовые. Однако, такой подход ограничивает гибкость и масштабируемость, поскольку квантовые ресурсы требуют особого контроля и управления, несовместимого со стандартными алгоритмами планирования. Отделение этих функций позволяет создать более эффективную систему, где квантовый сервис самостоятельно управляет своими ресурсами, а планировщик лишь запрашивает выполнение задач, обеспечивая тем самым оптимальное использование квантового оборудования и упрощая интеграцию с существующей высокопроизводительной вычислительной инфраструктурой. Такая архитектура открывает возможности для более динамического распределения ресурсов и адаптации к изменяющимся требованиям задач, что критически важно для развития квантовых вычислений.

Моделирование на GPU показывает, что время вычислений растет экспоненциально <span class="katex-eq" data-katex-display="false">\Theta(2^{n})</span>, а накладные расходы на интерфейс <span class="katex-eq" data-katex-display="false">T_{\\mathrm{admit}}+T_{\\mathrm{poll}}</span> становятся пренебрежимо малыми при <span class="katex-eq" data-katex-display="false">n=29</span>, подтверждая, что накладные расходы на передачу данных асимптотически не влияют на общую вычислительную нагрузку.
Моделирование на GPU показывает, что время вычислений растет экспоненциально \Theta(2^{n}), а накладные расходы на интерфейс T_{\\mathrm{admit}}+T_{\\mathrm{poll}} становятся пренебрежимо малыми при n=29, подтверждая, что накладные расходы на передачу данных асимптотически не влияют на общую вычислительную нагрузку.

HPC-vQPU: Экспортная Модель Сервиса для Квантовых Вычислений

Архитектура HPC-vQPU представляет собой экспортную модель обслуживания, позволяющую виртуальным квантовым процессорам (QPU) функционировать в рамках систем высокопроизводительных вычислений (HPC), использующих пакетное планирование задач. Данный подход позволяет интегрировать ресурсы виртуальных QPU в существующую инфраструктуру HPC без необходимости внесения существенных изменений в системы управления заданиями и распределения ресурсов. Интеграция осуществляется посредством предоставления виртуального QPU как сервиса, доступного для выполнения задач в рамках пакетного расписания, что обеспечивает эффективное использование вычислительных ресурсов и упрощает масштабирование квантовых вычислений.

Архитектура HPC-vQPU использует исключительно исходящие соединения для повышения безопасности и соответствия политикам высокопроизводительных вычислений (HPC). Это означает, что виртуальные квантовые процессоры (vQPU) инициируют все сетевые соединения, не принимая входящие запросы. Такой подход минимизирует поверхность атаки, поскольку исключает необходимость открытия входящих портов и снижает риск несанкционированного доступа. Кроме того, исходящая связь упрощает интеграцию vQPU в существующую инфраструктуру HPC, где действуют строгие правила сетевой безопасности и контроля трафика, обеспечивая соответствие установленным политикам и процедурам.

В архитектуре HPC-vQPU ключевым элементом является ‘DeviceSnapshot’ — графовое представление виртуального устройства, используемое в качестве контракта на выполнение. Этот снимок состояния определяет конфигурацию и свойства виртуального квантового процессора (QPU) для конкретной задачи. Использование графовой структуры позволяет эффективно сериализовать и передавать информацию о QPU, обеспечивая минимальную задержку интерфейса сервиса — менее 20 мс. Это достигается за счет оптимизированной передачи данных и отсутствия необходимости в двусторонней коммуникации во время выполнения задачи, что критически важно для интеграции виртуальных QPU в пакетно-ориентированные HPC-системы.

Тестирование временной изоляции на одном устройстве подтвердило успешное привязывание к снимку: все восемь задач, запущенных во время шума на устройстве ibm-fez-0309, корректно выполнились с использованием идеального снимка после сброса устройства.
Тестирование временной изоляции на одном устройстве подтвердило успешное привязывание к снимку: все восемь задач, запущенных во время шума на устройстве ibm-fez-0309, корректно выполнились с использованием идеального снимка после сброса устройства.

DeviceSnapshot: Основа Воспроизводимости Квантовых Экспериментов

Снимок устройства (DeviceSnapshot) представляет собой комплексную запись, включающую критически важные характеристики аппаратной части. В него входят данные о топологии устройства, определяющей взаимосвязь между кубитами и их физическое расположение, калибровочные данные, необходимые для коррекции ошибок и обеспечения точности операций, и операционные параметры, описывающие текущее состояние и настройки устройства. Эти данные включают, но не ограничиваются, значениями смещений, частотами управления и параметрами импульсов. Сохранение и использование DeviceSnapshot обеспечивает воспроизводимость экспериментов и позволяет точно воссоздать условия выполнения задач на конкретном аппаратном обеспечении.

Механизм SnapshotBinding обеспечивает привязку каждой задачи к конкретному DeviceSnapshot, фиксируя тем самым контекст её выполнения и предотвращая отклонения (drift). Это достигается путем однозначного сопоставления идентификатора задачи с идентификатором DeviceSnapshot, что гарантирует, что каждая задача выполняется с использованием именно тех параметров устройства и данных калибровки, которые были актуальны на момент создания снимка. В результате, административные изменения, применяемые к устройству, не влияют на уже запущенные или запланированные задачи, что обеспечивает 100%-ную согласованность и воспроизводимость результатов выполнения.

Ядро симуляции (SimulationKernel) напрямую зависит от моментального снимка устройства (DeviceSnapshot) для обеспечения точного квантового моделирования. Использование DeviceSnapshot позволяет поддерживать достоверность результатов, поскольку все параметры и характеристики устройства зафиксированы на момент выполнения задачи. При этом, несмотря на фиксацию контекста, сложность симуляции сохраняется на ожидаемом экспоненциальном уровне — O(2^n) — что необходимо для моделирования квантовых систем с возрастающим числом кубитов. Отсутствие DeviceSnapshot привело бы к непредсказуемым результатам и нарушению корректности симуляции.

Анализ вероятностного распределения выходных состояний для усиленной двухкубитной идентичной схемы при нулевой и реальной калибровке (8192 снимка, среднее значение по 5 испытаниям) показывает, что отклонения от состояния <span class="katex-eq" data-katex-display="false">|00angle</span> незначительны и оцениваются стандартным отклонением.
Анализ вероятностного распределения выходных состояний для усиленной двухкубитной идентичной схемы при нулевой и реальной калибровке (8192 снимка, среднее значение по 5 испытаниям) показывает, что отклонения от состояния |00angle незначительны и оцениваются стандартным отклонением.

Управление Жизненным Циклом и Надежность Системы

Контрольная плоскость играет ключевую роль в управлении жизненным циклом задач и обеспечении надежной работы системы. Она осуществляет идентификацию каждого устройства, контролирует этапы выполнения задач — от инициации до завершения — и определяет полномочия сервисов, что позволяет эффективно распределять ресурсы. Такой подход гарантирует, что каждая задача получит необходимые ресурсы для выполнения в оптимальные сроки, а система в целом будет функционировать стабильно и предсказуемо. Управление идентификацией устройств также обеспечивает безопасность и предотвращает несанкционированный доступ к ресурсам, что особенно важно в сложных распределенных системах.

Исполнительная плоскость (ExecutionPlane) играет ключевую роль в процессе выполнения задач. Она не только принимает поступившие задания, но и активно взаимодействует с Планировщиком Пакетных Задач (BatchScheduler), направляя их на выполнение. Важным элементом этого процесса является использование Снимка Устройства (DeviceSnapshot) — актуального состояния устройства, которое обеспечивает корректность и воспроизводимость симуляций. Благодаря такому подходу, система способна эффективно распределять ресурсы и гарантировать надежное выполнение каждого задания, обеспечивая стабильную работу всей инфраструктуры.

В системе реализованы механизмы отказоустойчивости, обеспечивающие непрерывность работы даже при возникновении сбоев. Контрольная плоскость способна к самовосстановлению, достигая времени восстановления менее пяти секунд, что критически важно для поддержания стабильной работы. Параллельно, технология герметичного исполнения задач изолирует процессы от внешнего воздействия, гарантируя предсказуемость результатов и поддерживая пропускную способность в четыре задачи в минуту. Такой подход к обеспечению надежности позволяет системе эффективно функционировать в сложных и динамичных условиях, минимизируя влияние потенциальных ошибок и обеспечивая стабильность выполнения критически важных операций.

Анализ задержки для 28-32 кубитов на ibm-fez-0309 показал, что накладные расходы, видимые интерфейсу, составляют 3,4-5,9% от общей задержки, в то время как время, затрачиваемое на симуляцию на стороне исполнителя, растёт примерно как <span class="katex-eq" data-katex-display="false">2 	imes 2</span> с добавлением каждого кубита, а этапы разбора, построения шума и трансляции остаются относительно постоянными (подробные значения представлены в таблицах LABEL:supp-tab:latency и LABEL:supp-tab:sim-breakdown).
Анализ задержки для 28-32 кубитов на ibm-fez-0309 показал, что накладные расходы, видимые интерфейсу, составляют 3,4-5,9% от общей задержки, в то время как время, затрачиваемое на симуляцию на стороне исполнителя, растёт примерно как 2 imes 2 с добавлением каждого кубита, а этапы разбора, построения шума и трансляции остаются относительно постоянными (подробные значения представлены в таблицах LABEL:supp-tab:latency и LABEL:supp-tab:sim-breakdown).

К Масштабируемым и Воспроизводимым Квантовым Рабочим Процессам

Архитектура HPC-vQPU, делающая акцент на создании DeviceSnapshots и управлении жизненным циклом квантовых устройств, открывает возможности для масштабирования квантовых рабочих процессов. Создание моментальных снимков состояния квантового процессора позволяет сохранять и восстанавливать его конфигурацию, что критически важно для повторяемости экспериментов и отладки сложных алгоритмов. Управление жизненным циклом, включающее в себя инициализацию, калибровку и деактивацию квантовых ресурсов, обеспечивает их эффективное использование и предотвращает возникновение ошибок, связанных с нестабильностью аппаратного обеспечения. Благодаря этой системе, сложные квантовые вычисления могут быть разбиты на отдельные, управляемые этапы, что значительно упрощает их реализацию и повышает надежность результатов, делая квантовые симуляции более доступными и воспроизводимыми для широкого круга исследователей.

Интеграция HPC-vQPU с существующей инфраструктурой высокопроизводительных вычислений (HPC) обеспечивает бесшовное взаимодействие и оптимизацию использования ресурсов. Эта связь позволяет эффективно распределять задачи между классическими и квантовыми вычислительными системами, избегая узких мест и повышая общую производительность. Благодаря такой интеграции, HPC-vQPU не требует существенной перестройки существующей инфраструктуры HPC, что значительно снижает затраты на внедрение и упрощает процесс масштабирования. В результате, исследовательские группы и организации могут использовать свои существующие вычислительные ресурсы для поддержки квантовых вычислений, расширяя возможности моделирования и анализа данных, и открывая новые горизонты в различных областях науки и техники.

Предложенный подход открывает новые возможности для расширения доступа к возможностям квантового моделирования, что, в свою очередь, способствует инновациям в различных научных областях. Благодаря упрощению интеграции квантовых вычислений в существующую высокопроизводительную инфраструктуру, исследователи из самых разных дисциплин — от материаловедения и химии до фармацевтики и финансов — получают инструменты для решения задач, ранее недоступных. Это не просто увеличение вычислительной мощности, а принципиально новый способ исследования сложных систем, позволяющий проводить более точные и быстрые симуляции, ускоряя тем самым процесс открытия и разработки новых материалов, лекарств и технологий. Повышенная доступность квантовых ресурсов стимулирует междисциплинарное сотрудничество и расширяет границы научного познания, формируя основу для будущих технологических прорывов.

Представленная архитектура HPC-vQPU демонстрирует стремление к упрощению сложных систем, что находит отклик в философии элегантного дизайна. Как отмечает Грейс Хоппер: «Лучший способ объяснить — это сделать». Данный подход, разделяющий семантику устройства от ограничений пакетного планирования, позволяет создать более прозрачную и управляемую среду для квантового моделирования на гетерогенных вычислительных ресурсах. Разделение ответственности и четкая структура, заложенные в основу HPC-vQPU, позволяют избежать эффекта домино при внесении изменений, обеспечивая стабильность и предсказуемость системы. Особенно важно, что архитектура учитывает жизненный цикл виртуальных квантовых процессоров, что способствует эффективному использованию ресурсов и повышению общей производительности.

Что Дальше?

Представленная архитектура HPC-vQPU, безусловно, представляет собой шаг к более гибкому использованию гетерогенных вычислительных ресурсов. Однако, следует помнить, что любая оптимизация, направленная на повышение эффективности, неизбежно создает новые точки напряжения в системе. Разделение семантики устройства и ограничений пакетного планирования — элегантное решение, но оно лишь переносит сложность, а не устраняет её. В конечном счете, архитектура — это поведение системы во времени, а не схема на бумаге.

Ключевым вопросом остается масштабируемость. Способность эффективно управлять жизненным циклом виртуальных квантовых процессоров и обеспечивать их безопасное взаимодействие с базовой инфраструктурой HPC потребует дальнейшей разработки. Особенно важно исследовать, как адаптировать данную архитектуру к динамически изменяющимся вычислительным средам и новым поколениям квантовых устройств. Представленные «калиброванные снимки» — лишь один из возможных подходов, и необходимо изучить альтернативные методы сохранения и восстановления состояния.

В конечном итоге, ценность данной работы заключается не столько в конкретной реализации, сколько в постановке вопроса о необходимости целостного подхода к проектированию квантово-гибридных систем. Успех в этой области потребует не только технических инноваций, но и глубокого понимания принципов организации сложных систем, где структура определяет поведение, а оптимизация — лишь временное решение.


Оригинал статьи: https://arxiv.org/pdf/2605.28845.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-05-30 21:31