Enhancing Construction Site Analysis and Understanding with 3D Segmentation

2508.05922v1 cs.CV, cs.LG 2025-08-12
Авторы:

Sri Ramana Saketh Vasanthawada, Pengkun Liu, Pingbo Tang

Резюме на русском

## Контекст Управление и мониторинг прогресса строительных работ являются важными аспектами проектирования и строительства, но требуют значительных ресурсов и времени. Обычные методы мониторинга используют либо статические данные, либо затратные временем и ресурсами работы с данными на площадке. Это приводит к увеличению затрат и снижению эффективности. Задача автоматизации мониторинга строительного прогресса в трудных условиях становится крайне актуальной в поиске решений, которые обеспечивают точность и скорость. Кроме того, существующие методы ориентированы на внутренние пространства, где условия достаточно стабильны. В случае с ситуациями на строительных площадках, где помехи, динамические изменения и сложная структура представляют собой значительные проблемы, существующие модели не показывают достаточной эффективности. Необходима разработка новых алгоритмов, которые могут адаптироваться к таким условиям, обеспечивая более точный и эффективный мониторинг строительных работ. ## Метод В данной работе предлагается использовать два развитых трёхмерных раSEGMЕНТАЦИОННЫХ метода: Segment Anything Model (SAM) и Mask3D. Оба алгоритма были обучены на внутренних данных, но авторы исследуют их эффективность на сложных строительных площадках. SAM - это модель, которая использует глубокую нейронную сеть для выделения объектов на изображениях. Она тренируется для автоматического выделения объектов в изображениях с помощью метода подсказок. Mask3D, в свою очередь, является расширением SAM, расширенном для обработки трёхмерных структур и данных. Авторы проводят эксперименты с тем, чтобы оценить эффективность этих моделей в условиях строительных площадок, на которых обычно используются только статические данные. ## Результаты Для исследования эффективности SAM и Mask3D на строительных площадках были проведены сравнительные эксперименты с использованием реальных данных. Изучены различные условия, включая внутренние и внешние условия, где существуют динамические изменения. Эксперименты показали, что оба модели демонстрируют высокую точность в распознавании объектов и выделении информации внутри трёхмерных моделей. Однако SAM более эффективен в условиях с меньшим динамическим изменением, в то время как Mask3D показал более высокую точность в сложных ситуациях с динамическими изменениями. Таким образом, результаты показывают, что оба метода могут быть эффективно использованы в строительных проектах, но необходимо учитывать их особенности и применять их в зависимости от условий строительной площадки. ## Значимость Получен

Abstract

Monitoring construction progress is crucial yet resource-intensive, prompting the exploration of computer-vision-based methodologies for enhanced efficiency and scalability. Traditional data acquisition methods, primarily focusing on indoor environments, falter in construction site's complex, cluttered, and dynamically changing conditions. This paper critically evaluates the application of two advanced 3D segmentation methods, Segment Anything Model (SAM) and Mask3D, in challenging outdoor and indoor conditions. Trained initially on indoor datasets, both models' adaptability and performance are assessed in real-world construction settings, highlighting the gap in current segmentation approaches due to the absence of benchmarks for outdoor scenarios. Through a comparative analysis, this study not only showcases the relative effectiveness of SAM and Mask3D but also addresses the critical need for tailored segmentation workflows capable of extracting actionable insights from construction site data, thereby advancing the field towards more automated and precise monitoring techniques.

Ссылки и действия