Automated Facility Enumeration for Building Compliance Checking using Door Detection and Large Language Models

2509.17283v1 cs.CV, cs.AI, cs.ET 2025-09-24
Авторы:

Licheng Zhan, Bach Le, Naveed Akhtar, Tuan Ngo

Резюме на русском

## Контекст Обеспечение соответствия нормативным требованиям зданий и сооружений (Building Compliance Checking, BCC) является важной задачей для гарантии безопасности, эффективности и соответствия построек законодательным стандартам. Одним из ключевых аспектов BCC является точная энумерация фасадов и их распределения в помещениях. Несмотря на его критическую роль, данная проблема до сих пор остается недостаточно исследована, что создает существенные сложности для автоматизации процесса BCC. Ручная энумерация требует много времени и труда, что делает ее неэффективной. Новые возможности, предоставляемые Large Language Models (LLMs), открывают путь к улучшению автоматизации этой задачи, объединяя возможности визуального распознавания и разума. Мы предлагаем новую задачу BCC — автоматизированная энумерация фасадов, которая заключается в проверке количества каждого типа фасадов на соответствие законодательным требованиям. Для решения этой задачи мы предлагаем метод, комбинирующий детектирование дверей с LLM-based обработкой запросов, чтобы повысить точность и универсальность решения. ## Метод Мы предлагаем новое решение для автоматизированной энумерации фасадов в рамках процесса BCC. Метод основывается на двух основных компонентах: детектировании дверей и использовании LLM. В первом этапе, мы используем компьютерное зрение для точного обнаружения дверей на планах зданий. Это позволяет определить входы и выходы в каждой комнате. Во втором этапе, мы применяем LLM для осмысления входных данных и генерации описания распределения фасадов. Для повышения точности и универсальности, мы применяем Chain-of-Thought (CoT) pipeline, которая позволяет LLM проводить логический анализ и делать более точные выводы. Мы ставим целью обеспечить общую обработку различных типов фасадов и адаптацию к разным данным, включая реальные и синтетические планы. ## Результаты Мы провели эксперименты с использованием реальных и синтетических данных планов зданий, чтобы проверить эффективность нашего подхода. Для тренировки и тестирования мы использовали различные датасеты с разными типами фасадов и распределениями. Результаты показали, что метод обеспечивает высокую точность и общую универсальность. Мы сравнили нашу реализацию с другими подходами и показали, что наш подход превосходит другие методы по метрикам точности и универсальности. Эксперименты показали, что наш метод не только эффективен, но и может быть легко адаптирован к разным условиям и задачам в области BCC. ## Значимость Метод, представленный в нашей работе, имеет большое значение для различных областей, включая проектировани

Abstract

Building compliance checking (BCC) is a critical process for ensuring that constructed facilities meet regulatory standards. A core component of BCC is the accurate enumeration of facility types and their spatial distribution. Despite its importance, this problem has been largely overlooked in the literature, posing a significant challenge for BCC and leaving a critical gap in existing workflows. Performing this task manually is time-consuming and labor-intensive. Recent advances in large language models (LLMs) offer new opportunities to enhance automation by combining visual recognition with reasoning capabilities. In this paper, we introduce a new task for BCC: automated facility enumeration, which involves validating the quantity of each facility type against statutory requirements. To address it, we propose a novel method that integrates door detection with LLM-based reasoning. We are the first to apply LLMs to this task and further enhance their performance through a Chain-of-Thought (CoT) pipeline. Our approach generalizes well across diverse datasets and facility types. Experiments on both real-world and synthetic floor plan data demonstrate the effectiveness and robustness of our method.

Ссылки и действия

Связанные статьи

Improving watermelon (Citrullus lanatus) disease classification with generative ...

#### Контекст Агроиндустрия сталкивается с вопросами, связанными с распознаванием и классификацией болезней растений, к...

2025-08-15

DoorDet: Semi-Automated Multi-Class Door Detection Dataset via Object Detection ...

## Контекст Детальная распознаваемость и классификация различных типов дверей на планах помещений является ключевым зада...

2025-08-13