Гауссовские всплески в кармане: Реальное время на мобильных устройствах

Автор: Денис Аветисян


Новая методика Gaussian Splatting позволяет добиться фотореалистичной 3D-графики в реальном времени прямо на смартфонах и планшетах.

🚀 Квантовые новости

Подключайся к потоку квантовых мемов, теорий и откровений из параллельной вселенной.
Только сингулярные инсайты — никакой скуки.

Присоединиться к каналу
Разработанный метод Mobile-GS представляет собой первую в своем роде систему Gaussian Splatting, способную достигать скорости рендеринга в 116 FPS при разрешении 1600×1063 на мобильном устройстве со Snapdragon 8 Gen 3, при этом, благодаря интеграции методов, учитывающих глубину, сжатия и дистилляции, она обеспечивает сопоставимое с оригинальным 3DGS качество изображения, снижая требования к объему памяти до 4.8 MB и достигая 1098 FPS на неограниченной сцене, что открывает возможности для эффективного развертывания на мобильных платформах.
Разработанный метод Mobile-GS представляет собой первую в своем роде систему Gaussian Splatting, способную достигать скорости рендеринга в 116 FPS при разрешении 1600×1063 на мобильном устройстве со Snapdragon 8 Gen 3, при этом, благодаря интеграции методов, учитывающих глубину, сжатия и дистилляции, она обеспечивает сопоставимое с оригинальным 3DGS качество изображения, снижая требования к объему памяти до 4.8 MB и достигая 1098 FPS на неограниченной сцене, что открывает возможности для эффективного развертывания на мобильных платформах.

Mobile-GS — оптимизированный метод Gaussian Splatting, использующий глубину, нейронные сети и сжатие для эффективного рендеринга на мобильных платформах.

Несмотря на впечатляющие результаты, современные методы Gaussian Splatting (GS) предъявляют высокие требования к вычислительным ресурсам и объему памяти, затрудняя их применение на мобильных устройствах. В данной работе, представленной под названием ‘Mobile-GS: Real-time Gaussian Splatting for Mobile Devices’, предлагается оптимизированный метод GS, позволяющий добиться работы в реальном времени на мобильных платформах. Ключевым нововведением является схема рендеринга, независимая от порядка сортировки, дополненная нейросетевыми улучшениями и эффективными техниками сжатия. Сможет ли Mobile-GS открыть новые возможности для приложений дополненной и виртуальной реальности на мобильных устройствах, требующих высокой производительности и качества изображения?


Предел Реалистичности: Вызов Современной 3D-Визуализации

Высококачественная трехмерная визуализация традиционно требует значительных вычислительных ресурсов, что ограничивает её применение в приложениях реального времени. Создание детализированных и реалистичных изображений предполагает сложные вычисления освещения, затенения и текстурирования для каждого пикселя, что особенно обременительно для графических процессоров. Этот фактор становится критическим препятствием для таких областей, как виртуальная и дополненная реальность, интерактивные игры и симуляторы, где требуется мгновенная обратная связь и плавность изображения. По мере увеличения сложности сцен и детализации моделей, потребность в вычислительной мощности растёт экспоненциально, что заставляет разработчиков искать инновационные методы оптимизации и компромиссов между качеством изображения и производительностью.

Традиционные методы рендеринга, такие как стандартное альфа-смешивание, часто требуют предварительной сортировки объектов по глубине для корректного отображения прозрачности. Этот процесс, известный как depth sorting, становится серьезным узким местом производительности, особенно в сложных сценах с большим количеством перекрывающихся прозрачных элементов. Сортировка по глубине требует значительных вычислительных затрат, поскольку необходимо определить порядок отрисовки каждого пикселя, чтобы избежать визуальных артефактов, таких как неправильное смешивание цветов. Чем больше прозрачных объектов и чем сложнее их взаимное расположение, тем больше времени требуется на сортировку, что существенно снижает частоту кадров и ухудшает пользовательский опыт, особенно на мобильных платформах с ограниченными ресурсами.

В условиях стремительного развития мобильных технологий и повсеместного распространения приложений дополненной и виртуальной реальности, потребность в эффективных и масштабируемых методах трехмерной графики становится критически важной. Ограниченные вычислительные ресурсы мобильных устройств диктуют необходимость разработки алгоритмов, способных обеспечить высокую производительность при минимальном энергопотреблении. Традиционные подходы, требующие значительных затрат памяти и процессорного времени, оказываются неприменимыми для широкого спектра мобильных приложений. Поэтому исследования направлены на создание инновационных техник рендеринга, оптимизированных для архитектуры мобильных процессоров и позволяющих достичь реалистичной графики без ущерба для скорости и автономности работы устройств.

В отличие от 3DGS, предложенный Mobile-GS устраняет плиточную отрисовку и сортировку 3D-гауссиан, вычисляя цвет каждого гауссиана для соответствующих пикселей параллельно и накапливая значения цвета, а затем выполняя композицию переднего и заднего плана за один проход с использованием стратегии глубино-зависимой отрисовки, не зависящей от порядка, для повышения производительности и качества изображения.
В отличие от 3DGS, предложенный Mobile-GS устраняет плиточную отрисовку и сортировку 3D-гауссиан, вычисляя цвет каждого гауссиана для соответствующих пикселей параллельно и накапливая значения цвета, а затем выполняя композицию переднего и заднего плана за один проход с использованием стратегии глубино-зависимой отрисовки, не зависящей от порядка, для повышения производительности и качества изображения.

Mobile-GS: Новый Подход к Мобильному Рендерингу

Mobile-GS представляет собой решение для рендеринга в реальном времени, основанное на Gaussian Splatting и оптимизированное для мобильных устройств. В отличие от традиционных методов рендеринга, требующих значительных вычислительных ресурсов, Mobile-GS позволяет достичь высокого качества 3D-графики непосредственно на мобильных платформах. Это достигается за счет использования гауссовых сплэтов — параметрических трехмерных объектов, которые эффективно аппроксимируют геометрию сцены и позволяют избежать сложных вычислений, характерных для полигонального рендеринга. Решение разработано с учетом ограничений мобильных процессоров и памяти, обеспечивая баланс между визуальной точностью и производительностью.

В основе Mobile-GS лежит механизм рендеринга, использующий осведомлённую о глубине отрисовку в произвольном порядке (depth-aware order-independent rendering). Традиционные методы рендеринга требуют предварительной сортировки полигонов по глубине для корректного отображения перекрывающихся объектов, что является ресурсоёмкой операцией, особенно на мобильных устройствах. Mobile-GS обходит эту необходимость, используя свойства Gaussian Splatting и алгоритмы, позволяющие определять видимость и порядок отрисовки фрагментов непосредственно на основе информации о глубине, что значительно снижает вычислительную нагрузку и повышает производительность.

Реализация Mobile-GS обеспечивает высококачественную 3D-графику на мобильных устройствах, достигая частоты кадров до 127 FPS. Это стало возможным благодаря оптимизации процесса рендеринга, позволяющей эффективно использовать вычислительные ресурсы мобильных процессоров и графических ускорителей. Достигнутая производительность позволяет отображать сложные 3D-сцены в реальном времени без снижения качества изображения или возникновения задержек, что критически важно для интерактивных приложений и игр на мобильных платформах.

Сравнение алгоритмов Speedy-Splat, SortFreeGS, 3DGS и Mobile-GS демонстрирует, что предложенный Mobile-GS обеспечивает более четкую визуализацию благодаря увеличенному масштабу для лучшего различия деталей.
Сравнение алгоритмов Speedy-Splat, SortFreeGS, 3DGS и Mobile-GS демонстрирует, что предложенный Mobile-GS обеспечивает более четкую визуализацию благодаря увеличенному масштабу для лучшего различия деталей.

Оптимизация Производительности: Ключ к Мобильному Рендерингу

Mobile-GS использует методы снижения сложности модели, такие как дистилляция сферических гармоник первого порядка и нейронная векторная квантизация. Дистилляция сферических гармоник позволяет аппроксимировать сложные функции освещения и геометрии, уменьшая вычислительную нагрузку. Нейронная векторная квантизация, в свою очередь, сокращает количество параметров, необходимых для представления данных, путем замены векторов на ближайшие центроиды кластеров. Оба метода совместно направлены на уменьшение размера модели и снижение требований к вычислительным ресурсам без существенной потери качества визуализации.

Оптимизация рендеринга в Mobile-GS включает в себя отсечение примитивов, основанное на их вкладе в итоговое изображение. Этот процесс, известный как contribution-based pruning, использует параметры гауссовой непрозрачности (Gaussian opacity) и масштаба (scale) для определения значимости каждого примитива. Примитивы с низким значением вклада, определяемым комбинацией этих параметров, отбрасываются, что приводит к уменьшению количества обрабатываемых элементов и повышению производительности. Использование гауссовой функции позволяет плавно регулировать степень отсечения, обеспечивая баланс между качеством изображения и скоростью рендеринга.

Оптимизации, включающие дистилляцию сферических гармоник первого порядка и нейронную векторную квантизацию, в сочетании с эффективной отрисовкой, позволяют Mobile-GS достигать производительности в реальном времени на мобильных GPU. На тестовых конфигурациях достигнута частота кадров до 116 FPS при разрешении 1600×1063, при этом общий объем хранимых данных составляет всего 4.8 MB. Данные показатели позволяют использовать модель на мобильных устройствах без значительной потери качества визуализации.

Сравнительный анализ показывает, что разработанный Mobile-GS обеспечивает лучшую производительность по сравнению с существующими методами, демонстрируя оптимальное соотношение между затратами памяти и частотой кадров в секунду (FPS).
Сравнительный анализ показывает, что разработанный Mobile-GS обеспечивает лучшую производительность по сравнению с существующими методами, демонстрируя оптимальное соотношение между затратами памяти и частотой кадров в секунду (FPS).

Подтверждение Эффективности и Влияние на Будущее Мобильной Графики

Система Mobile-GS подверглась тщательному тестированию с использованием датасета Mip-NeRF 360, что позволило оценить её возможности в рендеринге сложных сцен в реальном времени на базе мобильного процессора Snapdragon 8 Gen 3. Результаты продемонстрировали способность системы эффективно обрабатывать и отображать детализированные 3D-модели без значительных задержек, подтверждая её потенциал для использования в требовательных графических приложениях. Особенно важно, что система сохраняет высокую производительность даже при обработке самых сложных сцен, что открывает новые горизонты для мобильной графики и интерактивных 3D-опытов.

Система Mobile-GS демонстрирует значительный прогресс в поддержании стабильной производительности даже при длительных нагрузках. В ходе тестирования на базе Snapdragon 8 Gen 3, удалось эффективно предотвратить снижение частоты кадров, вызванное тепловым дросселированием. После достижения теплового равновесия, система стабильно поддерживала частоту кадров в 74 FPS, что свидетельствует о высокой эффективности разработанных алгоритмов управления энергопотреблением и теплоотводом. Это позволяет создавать продолжительные и сложные интерактивные 3D-приложения на мобильных устройствах без опасения внезапного падения производительности и потери пользовательского опыта.

Разработка Mobile-GS открывает широкие перспективы для применения технологий дополненной и виртуальной реальности непосредственно на мобильных устройствах. Достигнув стабильной производительности в реальном времени, система позволяет создавать иммерсивные AR-приложения, например, для интерактивных образовательных целей или визуализации дизайна интерьера. В сфере виртуальной реальности это означает возможность запускать сложные VR-игры и приложения без необходимости использования мощных игровых консолей или персональных компьютеров. Кроме того, технология находит применение в мобильных играх, обеспечивая повышенный уровень графики и реализма, а также в интерактивных 3D-приложениях для профессиональной визуализации и моделирования, делая сложные расчеты и графику доступными в любом месте и в любое время.

Анализ времени выполнения Mobile-GS демонстрирует эффективность алгоритма в различных условиях.
Анализ времени выполнения Mobile-GS демонстрирует эффективность алгоритма в различных условиях.

За Гранью Реального Времени: Новая Эра Мобильной 3D-Графики

Метод Mobile-GS представляет собой принципиально новый подход к рендерингу 3D-графики на мобильных устройствах, успешно конкурируя с существующими решениями, такими как Speedy-Splat и SortFreeGS. В отличие от традиционных методов, которые часто сталкиваются с ограничениями вычислительной мощности и энергоэффективности, Mobile-GS демонстрирует возможность получения высококачественной 3D-графики в режиме реального времени, используя инновационные алгоритмы сжатия и оптимизации данных. Исследования показывают, что Mobile-GS не только сопоставим по производительности с существующими решениями, но и в некоторых случаях превосходит их, открывая перспективы для создания более детализированных и интерактивных мобильных 3D-приложений и игр. Данный подход представляет собой значительный шаг вперед в области мобильной графики, позволяя расширить границы возможностей, доступных пользователям.

Дальнейшие исследования направлены на разработку адаптивных стратегий компрессии и отсечения данных, что позволит еще больше повысить производительность мобильной 3D-графики. Планируется динамически регулировать уровень детализации и степень сжатия в зависимости от характеристик сцены и вычислительных возможностей устройства. Это включает в себя алгоритмы, которые могут интеллектуально определять, какие элементы требуют высокой детализации, а какие могут быть упрощены без заметной потери качества изображения. Оптимизация данных будет происходить в реальном времени, обеспечивая плавную и отзывчивую работу даже на мобильных устройствах с ограниченными ресурсами, что открывает возможности для создания более сложных и интерактивных 3D-приложений.

Развитие данной технологии открывает перспективы для создания принципиально новых, глубоко погружающих и интерактивных 3D-опытов на мобильных устройствах. Возможность отрисовки сложных сцен в реальном времени, без ущерба для производительности, позволяет стирать границы между физическим и цифровым мирами. Представьте себе дополненную реальность, где виртуальные объекты не просто накладываются на изображение с камеры, а полноценно взаимодействуют с окружающей средой и реагируют на действия пользователя с невиданной ранее реалистичностью. Такие технологии найдут применение в широком спектре областей — от игр и развлечений до образования, проектирования и даже медицины, создавая новые способы взаимодействия с информацией и окружающим пространством.

Результаты пользовательского исследования показали, что предложенный нами Mobile-GS превосходит методы 3DGS (Kerbl et al., 2023) и LocoGS-S (Shin et al., 2025) по оценкам качества рендеринга, что подтверждается более высокой долей положительных отзывов пользователей.
Результаты пользовательского исследования показали, что предложенный нами Mobile-GS превосходит методы 3DGS (Kerbl et al., 2023) и LocoGS-S (Shin et al., 2025) по оценкам качества рендеринга, что подтверждается более высокой долей положительных отзывов пользователей.

Исследование, представленное в данной работе, демонстрирует неизбежную эволюцию технологий. Стремление к оптимизации рендеринга Gaussian Splatting для мобильных устройств — это не просто техническая задача, а иллюстрация того, как элегантная теория всегда сталкивается с суровой реальностью аппаратных ограничений. Авторы, стремясь к реальному времени, вынуждены идти на компромиссы в точности и детализации, что вполне закономерно. Как заметила Фэй-Фэй Ли: «Искусственный интеллект — это не замена человеческому интеллекту, а расширение его возможностей». Здесь можно увидеть аналогию: Mobile-GS не отменяет необходимость мощных графических карт, а позволяет приблизиться к качеству рендеринга на менее производительных устройствах, расширяя возможности мобильных платформ. Каждая «революционная» технология, как бы ни была изящна, рано или поздно превращается в техдолг, требующий постоянной поддержки и адаптации.

Куда Ведет Эта Дорога?

Представленная работа, несомненно, демонстрирует умение выжать производительность из Gaussian Splatting на мобильных устройствах. Однако, иллюзии не должно быть: каждое ускорение — это лишь отсрочка неизбежного. Проблема не в алгоритме, а в экспоненциальном росте данных. Рано или поздно, даже квантование и прунинг не спасут от необходимости хранить и обрабатывать всё больше и больше гауссиан. В конечном итоге, мы не рендерим — мы просто откладываем неминуемое.

Следующим шагом, вероятно, станет попытка уйти от явного хранения геометрии. Использование генеративных моделей для «на лету» создания гауссиан, возможно, позволит уменьшить footprint, но это лишь переложит вычислительную нагрузку на другую сторону весов. А багтрекер, как дневник боли, будет пополняться новыми артефактами, порожденными несовершенством генератора.

Оптимизация — бесконечный танец. С каждым новым «решением» появляется новая проблема. И, в конечном счете, нужно признать: у нас не культура DevOps, у нас культ DevOops. Мы не строим надежные системы, мы просто быстро чиним то, что сломалось. И это — данность, которую следует принять.


Оригинал статьи: https://arxiv.org/pdf/2603.11531.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-03-13 14:33