PixCuboid: Room Layout Estimation from Multi-view Featuremetric Alignment
2508.04659v1
cs.CV, I.4
2025-08-09
Авторы:
Gustav Hanning, Kalle Åström, Viktor Larsson
Резюме на русском
**Резюме**
В статье представлена PixCuboid — метод оптимизации для оценки комнатных локайтов на основе много birds-eye-view алайнмента тяжёлых deep features. Это решение предназначено для задачи поиска плоскостей по комнатным пространствам, где существуют проблемы, связанные с неоднородными источниками данных и сложностями быстрого роста лосса. Разработчики продемонстрировали возможность использовать простые начальные геометрические шаблоны для инициализации оптимизации. Для оценки метода были представлены два новых бенчмарка на основе ScanNet++ и 2D-3D-Semantics с точно проверенными 3D комнатными локайтами. Авторы показали, что PixCuboid значительно превосходит конкурентные модели по точности и решает вопросы многокомнатной оценки. Модель и код доступны в репозитории: https://github.com/ghanning/PixCuboid.
Abstract
Coarse room layout estimation provides important geometric cues for many
downstream tasks. Current state-of-the-art methods are predominantly based on
single views and often assume panoramic images. We introduce PixCuboid, an
optimization-based approach for cuboid-shaped room layout estimation, which is
based on multi-view alignment of dense deep features. By training with the
optimization end-to-end, we learn feature maps that yield large convergence
basins and smooth loss landscapes in the alignment. This allows us to
initialize the room layout using simple heuristics.
For the evaluation we propose two new benchmarks based on ScanNet++ and
2D-3D-Semantics, with manually verified ground truth 3D cuboids. In thorough
experiments we validate our approach and significantly outperform the
competition. Finally, while our network is trained with single cuboids, the
flexibility of the optimization-based approach allow us to easily extend to
multi-room estimation, e.g. larger apartments or offices. Code and model
weights are available at https://github.com/ghanning/PixCuboid.
Ссылки и действия
Дополнительные ресурсы: