A Scalable Machine Learning Pipeline for Building Footprint Detection in Historical Maps
2508.03564v1
cs.CV, I.4
2025-08-09
Авторы:
Annemarie McCarthy
Резюме на русском
Исторические карты представляют собой ценный источник для изучения прошлых ландшафтов и паттернов размещения населения. Однако методы машинного обучения, используемые для извлечения построек из этих карт, часто ограничиваются городскими районами и требуют больших вычислительных ресурсов, что сделало их менее эффективными для анализа расселенных регионов. В статье предлагается новая масштабируемая и эффективная методология, основанная на машинном обучении, для выявления построек на исторических картах с малой плотностью размещения. Метод включает в себя классификацию изображений с использованием нейронных сетей, чтобы отфильтровать ненужные области карт, и сегментацию для извлечения построек. На практике этот подход показал высокую точность и эффективность на тестовых данных из ирландских исторических карт. Например, пайплайн выявил поселение в 22 домах в Тулли, Ко. Гэйлви, которое было присутствовало на карте 1839 года, но отсутствовало на карте 1899 года, что может свидетельствовать о его заросшествии во времена Великой Голодной. Этот подход открывает новые возможности для исторических и археологических исследований.
Abstract
Historical maps offer a valuable lens through which to study past landscapes
and settlement patterns. While prior research has leveraged machine learning
based techniques to extract building footprints from historical maps, such
approaches have largely focused on urban areas and tend to be computationally
intensive. This presents a challenge for research questions requiring analysis
across extensive rural regions, such as verifying historical census data or
locating abandoned settlements. In this paper, this limitation is addressed by
proposing a scalable and efficient pipeline tailored to rural maps with sparse
building distributions. The method described employs a hierarchical machine
learning based approach: convolutional neural network (CNN) classifiers are
first used to progressively filter out map sections unlikely to contain
buildings, significantly reducing the area requiring detailed analysis. The
remaining high probability sections are then processed using CNN segmentation
algorithms to extract building features. The pipeline is validated using test
sections from the Ordnance Survey Ireland historical 25 inch map series and 6
inch map series, demonstrating both high performance and improved efficiency
compared to conventional segmentation-only approaches. Application of the
technique to both map series, covering the same geographic region, highlights
its potential for historical and archaeological discovery. Notably, the
pipeline identified a settlement of approximately 22 buildings in Tully, Co.
Galway, present in the 6 inch map, produced in 1839, but absent from the 25
inch map, produced in 1899, suggesting it may have been abandoned during the
Great Famine period.
Ссылки и действия
Дополнительные ресурсы: