CF3: Compact and Fast 3D Feature Fields
2508.05254v2
cs.CV, cs.AI
2025-08-11
Авторы:
Hyunjoon Lee, Joonkyu Min, Jaesik Park
Резюме на русском
#### Контекст
3D Gaussian Splatting (3DGS) — это метод, который позволяет хранить и обрабатывать 3D-данные в виде Gaussian feature fields. Этот метод находит применение в различных областях, таких как реалистичная генерация имиджей и AR/VR-системы. Однако, существующие подходы страдают от высоких затрат на вычисления из-за использования bottom-up оптимизации, которая обрабатывает 2D-данные как "правду" и не эффективно интегрирует информацию из 2D-фондациональных моделей. Мотивация для данного исследования заключается в создании более эффективной архитектуры, позволяющей сократить затраты на вычисления, сохранив точность и детализацию 3D-представления.
#### Метод
Мы предлагаем CF3 (Compact and Fast 3D Feature Fields) — подход, значительно сокращающий затраты на вычисления и оптимизирующий хранение 3D-данных. В процессе CF3 вначале выполняется быстрая фузированная обработка многоканальных 2D-данных с использованием предварительно обученных Гауссовых моделей. Это позволяет использовать существующую модель в качестве гибкой структуры для хранения и обработки 3D-данных. Затем, мы применяем адаптивный метод спарсинга, который уменьшает количество Гауссовых моделей, сохраняя при этом геометрические детали. Автокодировщик, работающий непосредственно на высокомерных 3D-данных, лучше адаптируется к распределению данных. Наша методология эффективнее и менее трудоемкая, чем Feature-3DGS, используя всего 5% Гауссовых моделей для построения 3D-представления.
#### Результаты
Мы проводили многочисленные эксперименты на различных датасетах, включая реалистичные 3D-сцены. Наши результаты показали, что CF3 достигает той же точности, что и Feature-3DGS, но используя значительно меньше вычислительных ресурсов. В частности, CF3 позволяет снизить количество Гауссовых моделей, необходимых для точного представления, на 95%, что значительно ускоряет процесс. Также мы проверили нашу модель на различных тестовых сценах, получив одинаковые или лучшие результаты по качеству геометрического представления, чем у существующих подходов.
#### Значимость
Предлагаемая модель CF3 может быть применена в различных областях, таких как машинное зрение, графика компьютера, AR/VR, а также в производственных процессах, требующих эффективных 3D-решений. Основное преимущество CF3 заключается в своей высокой эффективности. Она значительно сокращает вычислительные затраты, что делает ее привлекательной для применения в реальном времени. Будущие работы будут ориентированы на расширение CF3 для более сложных сцен, включая динамические сцены и видео-потоки.
#### Выводы
Мы представили
Abstract
3D Gaussian Splatting (3DGS) has begun incorporating rich information from 2D
foundation models. However, most approaches rely on a bottom-up optimization
process that treats raw 2D features as ground truth, incurring increased
computational costs. We propose a top-down pipeline for constructing compact
and fast 3D Gaussian feature fields, namely, CF3. We first perform a fast
weighted fusion of multi-view 2D features with pre-trained Gaussians. This
approach enables training a per-Gaussian autoencoder directly on the lifted
features, instead of training autoencoders in the 2D domain. As a result, the
autoencoder better aligns with the feature distribution. More importantly, we
introduce an adaptive sparsification method that optimizes the Gaussian
attributes of the feature field while pruning and merging the redundant
Gaussians, constructing an efficient representation with preserved geometric
details. Our approach achieves a competitive 3D feature field using as little
as 5% of the Gaussians compared to Feature-3DGS.
Ссылки и действия
Дополнительные ресурсы: