MeshCoder: LLM-Powered Structured Mesh Code Generation from Point Clouds

2508.14879v2 cs.GR, cs.CV 2025-08-25
Авторы:

Bingquan Dai, Li Ray Luo, Qihong Tang, Jie Wang, Xinyu Lian, Hao Xu, Minghan Qin, Xudong Xu, Bo Dai, Haoqian Wang, Zhaoyang Lyu, Jiangmiao Pang

Резюме на русском

## Контекст Реконструкция 3D-объектов в программный код является ключевым заданием для приложений, таких как обратный инженеринг и редактирование форм. Однако существующие методы часто ограничены доменом специфических языков (DSL) и небольшими масштабными данными, что ограничивает их возможность моделировать сложные геометрические структуры и структуры. Для решения этих проблем, мы предлагаем MeshCoder — новую систему, которая преобразует сложные 3D-объекты из точечных облаков в редактируемый Python-код Blender. Мы разработали расширенный набор экспрессивных Blender-API, который может синтезировать сложные геометрические структуры. Используя эти API, мы создали большую парную коллекцию данных объектов и кода, где каждый объект соответствует специально разбитому на части коду. Мы обучили многомодальный модель глубокого обучения (LLM), которая преобразует точечные облака в выполняемый код Blender. Наш подход не только показал высокую точность в задачах преобразования геометрии в код, но также обеспечил интуитивное редактирование геометрии и топологии через простые изменения кода. Кроме того, наш представительный код повышает мощность LLMs в задачах понимания 3D-форм. Эти достижения делают MeshCoder мощным и гибким инструментом для программной реконструкции и понимания 3D-форм. Домашняя страница проекта доступна по этой ссылке. ## Метод MeshCoder использует многомодальную модель глубокого обучения (LLM) для преобразования точечных облаков в код Blender Python. Мы разработали собственный набор Blender-API, который может синтезировать сложные геометрические структуры. Эти API используются для построения парной коллекции данных, где каждый объект разбит на части кода с определенным семантическим назначением. Мы обучаем LLM на этой коллекции, чтобы он мог преобразовывать точечные облака в код, выполняемый в Blender. Эта модель использует третьи сторонние библиотеки для обработки точечных облаков и кода, чтобы обеспечить преобразование. Это позволяет нашей модели извлекать информацию о геометрии и выражать ее в виде редактируемого Python-кода Blender. ## Результаты Мы проводили эксперименты, чтобы оценить точность и эффективность MeshCoder. Мы использовали большую парную коллекцию данных, состоящую из точечных облаков и соответствующего им кода. Мы сравнили результаты нашего подхода с другими методами, показав, что MeshCoder показывает высокую точность в преобразовании точечных облаков в код. Мы также проверяли возможности редактирования геометрии и топологии, проверяя, насколько просто можно внести изменения в код, чтобы изменить геометрию. Мы показали, что наш подход не только эффе

Abstract

Reconstructing 3D objects into editable programs is pivotal for applications like reverse engineering and shape editing. However, existing methods often rely on limited domain-specific languages (DSLs) and small-scale datasets, restricting their ability to model complex geometries and structures. To address these challenges, we introduce MeshCoder, a novel framework that reconstructs complex 3D objects from point clouds into editable Blender Python scripts. We develop a comprehensive set of expressive Blender Python APIs capable of synthesizing intricate geometries. Leveraging these APIs, we construct a large-scale paired object-code dataset, where the code for each object is decomposed into distinct semantic parts. Subsequently, we train a multimodal large language model (LLM) that translates 3D point cloud into executable Blender Python scripts. Our approach not only achieves superior performance in shape-to-code reconstruction tasks but also facilitates intuitive geometric and topological editing through convenient code modifications. Furthermore, our code-based representation enhances the reasoning capabilities of LLMs in 3D shape understanding tasks. Together, these contributions establish MeshCoder as a powerful and flexible solution for programmatic 3D shape reconstruction and understanding. The project homepage is available at \href{https://daibingquan.github.io/MeshCoder}{this link}.

Ссылки и действия