Генерируем CAD: От Эволюции Программ к Реалистичным Моделям

Автор: Денис Аветисян

Новый подход позволяет создавать разнообразные и правдоподобные CAD-модели, используя эволюционные алгоритмы и возможности современных моделей, работающих с изображениями и текстом.

Система CADEvolve осуществляет эволюцию форм, начиная с набора из 46 генераторов, итеративно уточняя их посредством предложений, обусловленных образцами-родителями, дополненного поиска и синтеза кода, и, наконец, проверяя и корректируя результаты на этапах исполнения, геометрической корректности и соответствия визуально-текстовому описанию, что обеспечивает отбор и расширение успешных решений.

Представлена система CADEvolve, использующая эволюционные алгоритмы и модели «зрение-язык» для генерации масштабного и разнообразного набора параметрических CAD-программ, демонстрирующих передовые результаты в задаче Image2CAD.

Несмотря на значительный прогресс в области искусственного интеллекта, создание сложных и реалистичных CAD-моделей остается сложной задачей из-за недостатка качественных обучающих данных. В данной работе представлена система CADEvolve: Creating Realistic CAD via Program Evolution, использующая эволюционные алгоритмы и языковые модели для генерации крупномасштабного и разнообразного набора параметрических CAD-программ. Разработанный подход позволил создать датасет из 1.3 миллионов скриптов, сопряженных с отрендеренной геометрией, и добиться передовых результатов в задаче Image2CAD на нескольких бенчмарках. Способна ли данная методика стимулировать дальнейшее развитие автоматизированного проектирования и открыть новые возможности для создания сложных инженерных объектов?

От простоты к совершенству: ограничения существующих подходов к CAD-моделированию

Традиционные процессы создания CAD-моделей характеризуются значительными трудозатратами и требуют высокой квалификации специалистов, что существенно замедляет процесс итераций проектирования. Разработка даже относительно простых изделий может потребовать нескольких дней или недель кропотливой работы, включающей ручное моделирование, внесение изменений и повторное тестирование. Эта зависимость от ручного труда не только увеличивает время выхода продукта на рынок, но и ограничивает возможности для исследования широкого спектра дизайнерских решений. Отсутствие автоматизации в ключевых этапах проектирования делает невозможным быстрое реагирование на изменения требований или оптимизацию конструкций под новые условия, что особенно критично в современных условиях динамично развивающегося производства и постоянной конкуренции.

Существующие генеративные методы автоматизированного проектирования (CAD) часто сталкиваются с ограничениями при работе со сложными геометрическими формами и не всегда способны адаптироваться к разнообразным требованиям к дизайну. Это связано с тем, что большинство алгоритмов оптимизированы для создания относительно простых моделей, таких как те, которые получаются при экструзии или вращении. При попытке генерировать более сложные конструкции, содержащие, например, органические формы, внутренние полости или множество взаимосвязанных элементов, производительность и точность значительно снижаются. Недостаточная гибкость в настройке параметров и ограничение на типы поддерживаемых операций также препятствуют созданию CAD-моделей, полностью отвечающих специфическим потребностям проектировщика. В результате, для получения желаемого результата часто требуется ручная доработка, нивелирующая преимущества автоматизации.

Автоматизация создания сложных CAD-моделей сталкивается с существенными трудностями, особенно когда речь заходит о программах, включающих в себя не просто выдавливание или вращение, а последовательность разнообразных операций. Существующие системы, как правило, ограничены базовыми примитивами, что делает невозможным создание сложных форм и конструкций без значительного ручного вмешательства. Проблема заключается в необходимости алгоритмически описать логику проектирования, включающую в себя, например, фрезеровку, сверление, создание фасок и другие операции, требующие от системы понимания геометрических зависимостей и правил конструирования. Разработка таких ‘Multi-Operation CAD Programs’ требует не только продвинутых алгоритмов, но и эффективных методов представления знаний о геометрии и технологических процессах, что остается сложной задачей для современной автоматизации.

Наблюдается растущая потребность в системах, способных автономно генерировать сложные CAD-модели на основе высокоуровневых спецификаций. Традиционный процесс проектирования, требующий значительных усилий и специализированных знаний, замедляет инновации и увеличивает стоимость разработки. Современные системы автоматизированного проектирования (САПР) часто ограничиваются простыми операциями, такими как выдавливание или вращение, и испытывают трудности при создании геометрий со сложной структурой и функциональностью. Разработка алгоритмов, способных интерпретировать общие требования к изделию — например, «создать корпус с определенными размерами и расположением отверстий» — и автоматически преобразовывать их в полную CAD-модель, является ключевой задачей для повышения эффективности и скорости разработки новых продуктов. Такие системы позволят инженерам сосредоточиться на более творческих аспектах проектирования, а не на рутинных задачах моделирования, что существенно ускорит процесс вывода инноваций на рынок.

Эволюционные траектории демонстрируют, как предложенные языковой моделью последовательные композиционные операции приводят к прогрессивному усложнению генерируемых CAD-моделей.

CADEvolve: Эволюционный подход к CAD-проектированию

В основе CADEvolve лежит эволюционный конвейер, состоящий из трех последовательных этапов: генерация предложений (propose), исполнение (execute) и фильтрация (filter). Данный подход позволяет систематически исследовать обширное пространство возможных CAD-программ, преодолевая вычислительные ограничения, связанные с полным перебором. На этапе генерации предложений формируются варианты кода, которые затем исполняются для создания 3D-моделей. После этого, этап фильтрации отбирает наиболее перспективные решения на основе заданных критериев, формируя основу для следующей итерации эволюционного процесса. Такая итеративная структура позволяет CADEvolve эффективно оптимизировать и адаптировать CAD-программы к конкретным задачам проектирования.

Параметрические генераторы представляют собой функциональные блоки, реализующие отображение входных параметров на трёхмерные твердотельные модели. Данный подход обеспечивает гибкость проектирования, позволяя изменять геометрию модели путем корректировки числовых значений параметров. Каждый генератор определяет конкретную логику построения геометрии, а изменение входных параметров приводит к соответствующему изменению результирующей 3D-модели. Использование параметрических генераторов позволяет автоматизировать процесс создания различных вариантов дизайна и исследовать широкое пространство возможных решений.

В основе CADEvolve лежит использование VLM GPT-5-mini для интеллектуального внесения изменений в код, написанный на языке CadQuery. GPT-5-mini выступает в роли генератора предложений по модификации кода, что позволяет системе исследовать различные варианты конструкторских решений. Функциональность заключается в автоматическом предложении изменений в существующем коде CadQuery, направленных на оптимизацию или изменение геометрии модели, что значительно расширяет возможности поиска оптимальных конструкций без непосредственного участия человека. Использование VLM обеспечивает более эффективное исследование пространства возможных CAD-программ, чем случайный перебор вариантов.

Система CADEvolve генерирует разнообразный корпус исполняемых скриптов CadQuery, обозначенный как ‘CADEvolve-P’, состоящий приблизительно из 8 x 10⁵ программ. Этот обширный набор программ позволяет проводить всестороннее исследование пространства возможных конструкторских решений. Разнообразие обеспечивается за счет алгоритмов эволюционного подхода, позволяющих создавать и оценивать широкий спектр вариантов, что необходимо для эффективного поиска оптимальных конструкций и выявления новых подходов к проектированию. Объем корпуса ‘CADEvolve-P’ критичен для охвата значительной части пространства поиска и обеспечения статистической значимости результатов.

CADEvolve-G представляет форму как сочетание текстового описания, Python-кода, определяющего геометрию, и списка предков, из которых она произошла в процессе эволюционного алгоритма CADEvolve.

Создание надежного обучающего корпуса: CADEvolve-C

Корпус ‘CADEvolve-C’ представляет собой канонизированный и нормализованный набор скриптов, полученный на основе сгенерированного корпуса ‘CADEvolve-P’. Процесс канонизации и нормализации был применен для унификации шаблонов кода и параметров, что обеспечивает согласованность данных и повышает эффективность обучения моделей. Этот корпус является ключевым компонентом для дальнейшей тонкой настройки моделей машинного обучения, как с использованием контролируемого обучения, так и обучения с подкреплением.

Канонизация в процессе создания обучающего корпуса заключается в унификации шаблонов кода и нормализации параметров. Это достигается путем приведения различных, но функционально эквивалентных, представлений кода к единому стандарту. Нормализация параметров подразумевает замену конкретных значений на общие, абстрактные представления. Такая обработка обеспечивает согласованность данных, устраняя вариации, не влияющие на конечный результат, и значительно повышает эффективность обучения модели за счет сокращения избыточности и упрощения процесса обобщения.

Корпус CADEvolve-C состоит из приблизительно 7 x 10⁵ скриптов, написанных на языке CadQuery, и служит основой для тонкой настройки моделей машинного обучения как с использованием контролируемого обучения, так и с подкреплением. Объем и структура этого корпуса позволяют эффективно обучать системы для генерации и модификации 3D-моделей, обеспечивая надежную базу данных для различных задач автоматизированного проектирования и оптимизации.

Для расширения возможностей обобщения системы и повышения ее способности к созданию разнообразных геометрических форм, обучающий набор данных был дополнен информацией из наборов данных ‘ABC’ и ‘ShapeNet’. Набор ‘ABC’ предоставляет данные о параметрических 3D-моделях, а ‘ShapeNet’ — крупномасштабную базу 3D-моделей, классифицированных по категориям. Интеграция этих данных позволяет системе изучать более широкий спектр форм и их характеристик, что способствует улучшению качества генерируемого кода и повышению точности получаемых 3D-моделей.

Обучение Image2CAD включает в себя кодирование многовидовых входных данных (7 для CADEvolve-P, 8 канонических для CADEvolve-C/RL) с помощью визуального энкодера VLM, декодирование в код CadQuery, предварительное обучение с помощью SFT на парах (изображение, скрипт) и последующую оптимизацию с помощью онлайн RL (Dr. GRPO + CPPO) с вознаграждением на основе IoU и штрафами за недопустимые результаты.

Уточнение CADEvolve: Тонкая настройка с помощью обучения с подкреплением

Для повышения эффективности CADEvolve используется двухэтапный процесс тонкой настройки. На первом этапе применяется обучение с учителем на основе парных данных, что позволяет модели изучить базовую связь между изображениями и соответствующими CAD-программами. Далее следует этап обучения с подкреплением, направленный на оптимизацию модели по заданным целевым функциям. Такой подход позволяет системе учиться на собственных успехах и неудачах, итеративно улучшая способность генерировать валидные и сложные CAD-программы, что обеспечивает повышение качества и точности генерируемого кода.

В фазе обучения с подкреплением используется алгоритм онлайн-обучения с подкреплением ‘Dr. CPPO’ (Deep Cross-Policy Proximal Optimization) и целевая функция ‘GRPO’ (Geometry-aware Reward Prediction Optimization). ‘Dr. CPPO’ позволяет модели обучаться непосредственно в процессе генерации CAD-программ, корректируя стратегию на основе получаемых вознаграждений. ‘GRPO’ оптимизирует функцию вознаграждения, учитывая геометрическую сложность и валидность генерируемых моделей, что способствует созданию более сложных и корректных CAD-программ. Данный подход обеспечивает итеративное улучшение способности системы генерировать CAD-модели, максимизируя соответствие заданным требованиям и оптимизируя целевые параметры.

Процесс обучения CADEvolve основан на итеративном улучшении генерации CAD-программ за счет анализа успешных и неуспешных попыток. Каждая итерация позволяет системе извлекать уроки из результатов, корректируя параметры генерации для повышения вероятности создания валидных и сложных CAD-моделей. Этот механизм самообучения позволяет CADEvolve постепенно оптимизировать свои алгоритмы, увеличивая эффективность и качество генерируемого кода, что приводит к улучшению производительности на стандартных наборах данных, таких как DeepCAD, Fusion360 Gallery и MCB.

Оценка производительности CADEvolve проводилась с использованием стандартных метрик и набора данных, включающего ‘DeepCAD’, ‘Fusion360 Gallery’ и ‘MCB’. Результаты демонстрируют передовые показатели в задаче Image2CAD на всех трех наборах данных, что подтверждает эффективность предложенного подхода к генерации CAD-программ на основе изображений. Использование этих общепринятых наборов данных позволяет объективно сравнить CADEvolve с другими существующими системами и подтвердить его превосходство в данной области.

В отличие от существующих наборов данных, ориентированных на простые схемы построения моделей, CADEvolve-M демонстрирует превосходство в реконструкции сложных деталей, созданных с использованием операций вращения, вытягивания и лофтинга, а также сложных узоров отверстий, с которыми традиционные подходы, такие как CAD-Recode и thecadrille, не справляются.

Изображение в CAD: Новые горизонты автоматизированного проектирования

Система CADEvolve демонстрирует возможность автоматизированного преобразования изображений в программы для автоматизированного проектирования (CAD), существенно упрощая и ускоряя начальный этап разработки. Вместо традиционного ручного моделирования, система способна генерировать CAD-программы непосредственно из визуальных данных, открывая новые перспективы для автоматизации процесса проектирования. Этот подход позволяет создавать сложные модели с минимальными усилиями, потенциально революционизируя индустрию разработки продуктов и позволяя дизайнерам сосредоточиться на более творческих аспектах своей работы. Функциональность ‘Image2CAD’ позволяет пользователям визуализировать концепцию и мгновенно получить рабочую модель, что значительно сокращает время выхода продукта на рынок.

Для обеспечения высокой точности и соответствия создаваемых CAD-моделей исходным изображениям, система CADEvolve подвергается строгой оценке с использованием метрик, таких как расстояние Чамфера и индекс пересечения (IoU). Расстояние Чамфера, измеряющее среднее расстояние от точек одной формы до ближайшей точки другой, позволяет оценить общее соответствие геометрии. В свою очередь, IoU, определяющий степень перекрытия между предсказанной и целевой геометрией, обеспечивает количественную оценку сходства. Комбинация этих метрик гарантирует, что автоматически сгенерированные CAD-программы не только визуально соответствуют входному изображению, но и обладают необходимой геометрической точностью для дальнейшего использования в инженерных расчетах и производстве.

Возможность автоматического преобразования изображений в CAD-модели открывает новую эру в проектировании продуктов. Благодаря этой технологии, сложные модели, требующие значительных усилий и времени для создания, становятся доступными для разработки с минимальными затратами. Проектировщики получают инструмент, позволяющий быстро воплощать идеи в цифровую форму, экспериментировать с различными вариантами и оптимизировать конструкции без необходимости ручного моделирования. Это значительно ускоряет процесс разработки, снижает издержки и позволяет сосредоточиться на инновациях и функциональности продукта, открывая путь к созданию более сложных и совершенных конструкций.

Успех данной методики демонстрирует впечатляющую синергию между эволюционными алгоритмами и современными языковыми моделями в решении сложных задач. В основе CADEvolve лежит обширный корпус из 7 945 параметрических генераторов, позволяющий системе не просто интерпретировать визуальный ввод, но и творчески конструировать сложные CAD-модели. Эволюционные алгоритмы, имитирующие процесс естественного отбора, оптимизируют параметры генераторов, а языковые модели обеспечивают понимание и интерпретацию изображений, направляя процесс эволюции к созданию геометрически точных и функциональных проектов. Такое сочетание позволяет системе эффективно преодолевать ограничения традиционных методов автоматизированного проектирования и открывает новые горизонты в области дизайна и инженерии.

Алгоритм CADEvolve-G способен генерировать разнообразные детали, используя различные операции моделирования, такие как выдавливание, вращение, лофтинг, сдвиг, создание оболочек, скругление, фаски, булевы операции и локальные узоры.

Исследование представляет собой попытку упростить сложный процесс генерации CAD-данных, используя эволюционные алгоритмы и модели «изображение-в-код». Авторы стремятся к созданию не просто работоспособных, но и разнообразных программ, способных описывать широкий спектр геометрических форм. В этом контексте особенно актуальна мысль Барбары Лисков: «Программы должны быть спроектированы так, чтобы изменения в одной части не влияли на другие». Именно следование этому принципу позволяет создавать модульные, легко модифицируемые CAD-системы, способные к длительной и успешной эволюции, что, в свою очередь, способствует созданию более надежных и понятных программных решений, способных к дальнейшему развитию и адаптации к новым задачам.

Куда Ведет Эволюция?

Представленный подход, несмотря на достигнутые результаты в генерации параметрических CAD-моделей, обнажает фундаментальную сложность автоматизированного проектирования. Успех CADEvolve зиждется на эволюционном поиске в пространстве программ, однако само это пространство остается бесконечно расширяющимся. Проблема не в увеличении объема данных, а в поиске принципиально новых, элегантных решений, которые не требуют слепого перебора вариантов. Очевидно, что необходимо переосмыслить метрики оценки, сместив акцент с простого соответствия изображениям на критерии инженерной целесообразности и оптимизации.

Дальнейшие исследования должны быть направлены на преодоление ограничений, присущих текущему поколению vision-language моделей. Способность понимать и интерпретировать сложные инженерные требования, выраженные естественным языком, остается далекой от совершенства. Важно исследовать возможности гибридных подходов, сочетающих эволюционные алгоритмы с формальными методами верификации и синтеза. В конечном итоге, истинный прогресс заключается не в увеличении скорости генерации, а в создании CAD-моделей, которые обладают внутренней согласованностью и соответствуют принципам рациональности.

Очевидно, что текущая парадигма, основанная на данных, требует критического переосмысления. Эволюция, как метод оптимизации, эффективна лишь в рамках заданного ландшафта. Но кто определяет этот ландшафт? И не является ли задача автоматизированного проектирования не столько поиском оптимального решения, сколько созданием самого пространства возможностей?

Оригинал статьи: https://arxiv.org/pdf/2602.16317.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-02-19 19:11

🚀 Квантовые новости