Enhancing Construction Site Analysis and Understanding with 3D Segmentation
2508.05922v1
cs.CV, cs.LG
2025-08-12
Авторы:
Sri Ramana Saketh Vasanthawada, Pengkun Liu, Pingbo Tang
Резюме на русском
## Контекст
Управление и мониторинг прогресса строительных работ являются важными аспектами проектирования и строительства, но требуют значительных ресурсов и времени. Обычные методы мониторинга используют либо статические данные, либо затратные временем и ресурсами работы с данными на площадке. Это приводит к увеличению затрат и снижению эффективности. Задача автоматизации мониторинга строительного прогресса в трудных условиях становится крайне актуальной в поиске решений, которые обеспечивают точность и скорость.
Кроме того, существующие методы ориентированы на внутренние пространства, где условия достаточно стабильны. В случае с ситуациями на строительных площадках, где помехи, динамические изменения и сложная структура представляют собой значительные проблемы, существующие модели не показывают достаточной эффективности. Необходима разработка новых алгоритмов, которые могут адаптироваться к таким условиям, обеспечивая более точный и эффективный мониторинг строительных работ.
## Метод
В данной работе предлагается использовать два развитых трёхмерных раSEGMЕНТАЦИОННЫХ метода: Segment Anything Model (SAM) и Mask3D. Оба алгоритма были обучены на внутренних данных, но авторы исследуют их эффективность на сложных строительных площадках.
SAM - это модель, которая использует глубокую нейронную сеть для выделения объектов на изображениях. Она тренируется для автоматического выделения объектов в изображениях с помощью метода подсказок. Mask3D, в свою очередь, является расширением SAM, расширенном для обработки трёхмерных структур и данных. Авторы проводят эксперименты с тем, чтобы оценить эффективность этих моделей в условиях строительных площадок, на которых обычно используются только статические данные.
## Результаты
Для исследования эффективности SAM и Mask3D на строительных площадках были проведены сравнительные эксперименты с использованием реальных данных. Изучены различные условия, включая внутренние и внешние условия, где существуют динамические изменения. Эксперименты показали, что оба модели демонстрируют высокую точность в распознавании объектов и выделении информации внутри трёхмерных моделей. Однако SAM более эффективен в условиях с меньшим динамическим изменением, в то время как Mask3D показал более высокую точность в сложных ситуациях с динамическими изменениями.
Таким образом, результаты показывают, что оба метода могут быть эффективно использованы в строительных проектах, но необходимо учитывать их особенности и применять их в зависимости от условий строительной площадки.
## Значимость
Получен
Abstract
Monitoring construction progress is crucial yet resource-intensive, prompting
the exploration of computer-vision-based methodologies for enhanced efficiency
and scalability. Traditional data acquisition methods, primarily focusing on
indoor environments, falter in construction site's complex, cluttered, and
dynamically changing conditions. This paper critically evaluates the
application of two advanced 3D segmentation methods, Segment Anything Model
(SAM) and Mask3D, in challenging outdoor and indoor conditions. Trained
initially on indoor datasets, both models' adaptability and performance are
assessed in real-world construction settings, highlighting the gap in current
segmentation approaches due to the absence of benchmarks for outdoor scenarios.
Through a comparative analysis, this study not only showcases the relative
effectiveness of SAM and Mask3D but also addresses the critical need for
tailored segmentation workflows capable of extracting actionable insights from
construction site data, thereby advancing the field towards more automated and
precise monitoring techniques.
Ссылки и действия
Дополнительные ресурсы: