SplitGaussian: Reconstructing Dynamic Scenes via Visual Geometry Decomposition

2508.04224v1 cs.CV 2025-08-09
Авторы:

Jiahui Li, Shengeng Tang, Jingxuan He, Gang Huang, Zhangye Wang, Yantao Pan, Lechao Cheng

Резюме на русском

Реконструкция динамических 3D-сцен из монокулярных видео остается сложной задачей из-за необходимости одновременного выявления движения, структуры и визуального вида на основе ограниченных наблюдений. Текущие методы, основанные на гауссовских сплаттингах, часто смешивают статические и динамические элементы в единой модели, что приводит к замешиванию мотива, геометрическим искажениям и визуальным фликеру. Авторы предлагают **SplitGaussian** — метод, разделяющий сцену на статические и динамические компоненты. Он аккуратно отделяет моделирование движения от фоновой геометрии, позволяя только динамической части меняться во времени. Это ведёт к уменьшению мотивных артефактов в статических регионах, повышению временной консистенции и фидбека во время обучения. Эксперименты показали, что SplitGaussian превосходит современные методы по качеству рендеринга, стабильности геометрии и разделению движения.

Abstract

Reconstructing dynamic 3D scenes from monocular video remains fundamentally challenging due to the need to jointly infer motion, structure, and appearance from limited observations. Existing dynamic scene reconstruction methods based on Gaussian Splatting often entangle static and dynamic elements in a shared representation, leading to motion leakage, geometric distortions, and temporal flickering. We identify that the root cause lies in the coupled modeling of geometry and appearance across time, which hampers both stability and interpretability. To address this, we propose \textbf{SplitGaussian}, a novel framework that explicitly decomposes scene representations into static and dynamic components. By decoupling motion modeling from background geometry and allowing only the dynamic branch to deform over time, our method prevents motion artifacts in static regions while supporting view- and time-dependent appearance refinement. This disentangled design not only enhances temporal consistency and reconstruction fidelity but also accelerates convergence. Extensive experiments demonstrate that SplitGaussian outperforms prior state-of-the-art methods in rendering quality, geometric stability, and motion separation.

Ссылки и действия