Автор: Денис Аветисян
В статье представлена система MHR, позволяющая создавать реалистичные и гибкие модели человека для широкого спектра приложений, от графики и компьютерного зрения до дополненной и виртуальной реальности.

MHR — параметрическая модель человека с отсоединенным скелетом и поверхностью, обеспечивающая независимый контроль над позой и формой, а также повышенную выразительность.
Создание реалистичной и управляемой анимации человека остается сложной задачей, требующей баланса между анатомической достоверностью и художественным контролем. В данной работе представлена модель MHR: Momentum Human Rig, параметрическая модель человеческого тела, сочетающая в себе гибкость современных систем риггинга и точность анатомически обоснованного представления формы. Благодаря разделению скелета и поверхности, MHR обеспечивает независимый контроль над позой и формой, открывая возможности для выразительной и реалистичной анимации. Позволит ли данная модель упростить интеграцию человеческих персонажей в AR/VR-приложения и графические конвейеры, расширяя границы возможностей цифрового моделирования?
Фундамент: От Параметрических Моделей к Цифровому Двойнику
Ранние попытки параметрического моделирования человека, такие как SMPL, заложили основу для создания цифровых двойников, однако столкнулись с ограничениями в выразительности и контроле, необходимыми для сложных задач. Эти модели, хоть и позволяли создавать базовые формы человеческого тела, страдали от недостаточной детализации и гибкости при воспроизведении широкого спектра движений и поз. Ограниченность параметров, определяющих форму и положение тела, препятствовала достижению реалистичной деформации и затрудняла тонкую настройку моделей для художественных целей. В результате, несмотря на значительный вклад в развитие области, первоначальные параметрические модели требовали дальнейшего усовершенствования для полноценной реализации потенциала цифровых людей в различных приложениях, от анимации и игр до виртуальной реальности и медицинских симуляций.
Ранние параметрические модели человеческого тела, такие как SMPL, в значительной степени опирались на блендшейпы — предопределенные формы, смешивающиеся для создания вариаций в геометрии. Этот подход, применявшийся как для моделирования общей формы тела, так и для его поз, неизбежно приводил к ограничениям в реалистичности деформаций. В частности, сложные движения и анатомические детали, выходящие за рамки предустановленных блендшейпов, воспроизводились неточно, создавая эффект неестественности. Художникам и аниматорам приходилось идти на компромиссы, ограничиваясь доступными формами, что снижало уровень контроля над конечным результатом и затрудняло создание действительно уникальных и выразительных персонажей. В итоге, зависимость от блендшейпов стала узким местом, препятствующим достижению высокого уровня реализма и художественной свободы в цифровом моделировании человека.
Модель SMPL-X, представляющая собой дальнейшее развитие базовой архитектуры SMPL, действительно внедрила важные улучшения, добавив детализированные модели рук и лица. Однако, несмотря на это расширение, фундаментальные принципы построения модели остались неизменными. Это означает, что ограничения, присущие оригинальной SMPL — в частности, касающиеся сложности достижения реалистичных деформаций и ограниченного контроля над мелкими деталями — в значительной степени сохраняются и в SMPL-X. Разработчики столкнулись с необходимостью балансировать между добавлением новых функций и сохранением вычислительной эффективности, что привело к компромиссам в выразительности и контроле над формой и позой цифрового человека. В результате, несмотря на значительный прогресс, модель SMPL-X остается подверженной тем же ограничениям, что и ее предшественница, что стимулирует дальнейшие исследования в области параметрического моделирования человека.

Разделение и Контроль: ATLAS и MHR
В рамках разработки ATLAS была внедрена ключевая концепция разделения скелета и поверхностной сетки. Этот подход позволяет независимо управлять и настраивать каждый из компонентов. Традиционно, в моделях человеческого тела скелет и сетка были жестко связаны, что ограничивало возможности деформации и анимации. Разделение этих элементов в ATLAS обеспечивает большую гибкость, позволяя изменять позу, форму и пропорции тела, не затрагивая структуру сетки, и наоборот. Это дает возможность создавать более реалистичные и детализированные модели, а также упрощает процесс анимации и редактирования.
Модель MHR (Motion Human Representation) развивает принцип, заложенный в ATLAS, путем создания параметрической модели человеческого тела, ориентированной на потребности индустрии и художественной реализации. В отличие от предшественника, MHR предоставляет расширенные возможности для тонкой настройки и управления деформациями тела, позволяя создавать более реалистичные и выразительные анимации. Параметрический подход обеспечивает гибкость в изменении пропорций тела и других характеристик, что упрощает адаптацию модели к различным задачам и стилям, а также повышает эффективность работы художников и аниматоров в производственном процессе.
Модель MHR использует разделение скелета и сетки для достижения реалистичных деформаций. Этот подход позволяет независимо управлять костной структурой и поверхностью, обеспечивая точное моделирование анатомически корректных движений. В дополнение к этому, MHR интегрирует семантические выражения, основанные на Системе Кодирования Лицевых Действий (FACS), что предоставляет художникам интуитивно понятный контроль над мимикой и эмоциями персонажа. Использование FACS позволяет задавать конкретные лицевые движения, такие как поднятие бровей или растяжение губ, напрямую через параметры модели, упрощая процесс анимации и обеспечивая высокую степень выразительности.

Уточнение Деформации: LBS и Корректировки Позы
Как ATLAS, так и MHR используют линейное смешивание кожи (Linear Blend Skinning, LBS) в качестве основного метода деформации сетки на основе преобразований костей. LBS предполагает, что влияние каждой кости на вершину сетки линейно, и деформирует вершину как взвешенную сумму положений, определяемых соответствующими костями. Веса, присваиваемые каждой кости, определяют степень влияния этой кости на данную вершину. Этот подход обеспечивает относительно эффективное вычисление деформации, однако может приводить к артефактам, особенно в областях, подверженных значительным изменениям позы, что требует применения дополнительных методов коррекции деформаций.
Линейное смешивание кожи (Linear Blend Skinning, LBS) — распространенный метод деформации сетки на основе трансформаций костей, однако он подвержен возникновению артефактов, таких как самопересечения и нереалистичные изгибы, особенно в экстремальных позах. Для устранения этих недостатков и повышения реалистичности деформации используются поправки поз (Pose Correctives). Данные поправки представляют собой дополнительные деформации, применяемые поверх результатов LBS, которые корректируют артефакты и улучшают соответствие формы сетки анатомически правдоподобному поведению при различных движениях и позах. Эффективность поправок поз заключается в их способности локально изменять форму сетки, компенсируя ограничения LBS и обеспечивая более плавные и реалистичные деформации.
В отличие от ATLAS и MHR, STAR использует разреженные и нелинейные деформации корректировки позы, что позволяет добиться более реалистичных результатов. Этот подход характеризуется разреженными активациями, то есть, небольшим количеством активных корректировок в любой момент времени. В результате, STAR демонстрирует существенно более низкую ошибку аппроксимации по сравнению с SMPL и SMPL-X, что подтверждается визуализацией на Рисунке 8 и детально описано в разделе оценки эффективности. Такая оптимизация позволяет повысить точность моделирования деформаций и снизить вычислительные затраты.
Для оптимизации производительности и снижения артефактов деформации в процессе Linear Blend Skinning, в STAR применяется строгое ограничение на количество костей, влияющих на каждый vertex — не более четырех. Это ограничение позволяет сократить вычислительные затраты, связанные с вычислением весов влияния каждой кости на каждый vertex, и предотвращает возникновение нежелательных визуальных искажений, таких как самопересечения или неестественные изгибы меша. Ограничение числа влияющих костей способствует более стабильной и предсказуемой деформации, что особенно важно для реалистичной анимации персонажей.

Оптимизация и Валидация: От Детализации до Наборов Данных
Для оптимизации производительности рендеринга, проекты MHR и ATLAS применяют методы упрощения геометрии, известные как Level of Detail (LOD). Суть заключается в автоматическом переключении между моделями различной детализации в зависимости от расстояния до камеры. Чем дальше объект, тем более упрощенная модель используется, что существенно снижает нагрузку на графический процессор и позволяет поддерживать высокую частоту кадров даже в сложных сценах. Эта техника позволяет эффективно использовать ресурсы, обеспечивая визуально приемлемое качество изображения при сохранении плавности и отзывчивости интерактивных приложений и симуляций.
Эффективность созданных моделей, предназначенных для реалистичной визуализации человеческого тела, подвергается тщательной проверке с использованием специализированных наборов данных, таких как 3DBodyTex. Данный набор данных позволяет оценить точность подгонки модели к реальным данным сканирования тела человека, что является ключевым показателем качества. Оценка проводится по множеству параметров, включая геометрическую точность и соответствие текстур, что позволяет выявить и устранить потенциальные недостатки в алгоритмах моделирования. Использование стандартизированных наборов данных, таких как 3DBodyTex, обеспечивает объективность оценки и позволяет сравнивать различные модели и подходы в области компьютерной графики и анимации.
В основе высококачественной визуализации и оптимизации моделей, используемых в MHR и ATLAS, лежит библиотека Momentum — мощный инструмент, разработанный на языках C++ и Python. Momentum обеспечивает критически важную инфраструктуру, беря на себя задачи определения и управления “скелетом” (rigging) персонажа, преобразования параметров, влияющих на его позу и выражение, а также процесс “натягивания” поверхности модели на этот скелет (skinning). Эта библиотека позволяет эффективно манипулировать и анимировать сложные 3D-модели, обеспечивая реалистичное и плавное движение, и выступает ключевым компонентом для достижения высокой производительности и визуального качества в приложениях, требующих точной и детализированной симуляции человеческой формы.

Исследование представляет модель MHR, что позволяет добиться независимого контроля над позой и формой персонажа. Это разделение скелета и поверхностной сетки открывает новые возможности для выразительности и реализма в графике, компьютерном зрении и AR/VR. Подобный подход к построению систем, где компоненты могут эволюционировать независимо, перекликается с мыслями Джона Маккарти: «Лучше всего решать проблемы, прежде чем они возникнут». В контексте MHR, предвосхищение необходимости в гибком контроле над анимацией и формой позволяет создавать более качественные и адаптивные модели, избегая сложностей, возникающих при жесткой интеграции компонентов. Это не просто техническое решение, а философия создания систем, способных к достойному старению и эволюции.
Что Дальше?
Представленная модель MHR, несомненно, представляет собой шаг вперед в области параметрического моделирования человека. Однако, как и любая система, стремящаяся к большей детализации и контролю, она лишь аккумулирует новые формы технического долга. Разделение скелета и поверхности — элегантное решение, но и оно потребует постоянного внимания к поддержанию когерентности и избежанию артефактов, особенно при экстремальных деформациях. Упрощение, необходимое для достижения интерактивности, всегда имеет свою цену в будущем, и эта цена — сложность управления и потенциальная потеря правдоподобия.
Очевидным направлением дальнейших исследований представляется разработка методов автоматического обучения и адаптации модели к индивидуальным особенностям человека. Недостаточно просто создать модель, способную воспроизводить широкий спектр движений; необходимо, чтобы она «помнила» и учитывала историю деформаций, чтобы избежать накопления ошибок и сохранить реалистичность анимации. Проблема уровней детализации (LOD) также остается актуальной, требуя более интеллектуальных алгоритмов, способных динамически оптимизировать сложность модели в зависимости от расстояния и угла обзора.
В конечном счете, ценность MHR, как и любой другой системы, будет определяться не только ее техническими характеристиками, но и способностью адаптироваться к меняющимся требованиям и решать новые задачи. Все системы стареют — вопрос лишь в том, делают ли они это достойно. Время — не метрика, а среда, в которой существуют системы, и в этой среде MHR предстоит пройти свой собственный путь.
Оригинал статьи: https://arxiv.org/pdf/2511.15586.pdf
Связаться с автором: https://www.linkedin.com/in/avetisyan/
Смотрите также:
- Искусственный интеллект и рефакторинг кода: что пока умеют AI-агенты?
- LLM: математика — предел возможностей.
- Кандинский 5.0: Искусство генерации изображений и видео
- Волны под контролем: Ускорение моделирования материалов с дефектами
- Квантовые симуляторы: Преодолевая ограничения памяти
- Квантовое обучение: новый взгляд на фазовые переходы
- Маленький шаг в скрытом пространстве — огромный скачок для изображения
- Квантовая схема: адаптация к шуму для многочиповых систем
- Квантовая симуляция без издержек: новый подход к динамике открытых систем
- Квантовое моделирование затухающих волн: новый подход к точности и эффективности
2025-11-20 19:05