VA-Blueprint: Uncovering Building Blocks for Visual Analytics System Design

2508.07497v1 cs.HC, cs.AI 2025-08-13
Авторы:

Leonardo Ferreira, Gustavo Moreira, Fabio Miranda

Резюме на русском

## Контекст Создание и развитие визуальных аналитических (VA) систем является сложной и итеративной задачей, требующей идеального синтеза обработки данных, аналитических способностей и визуализационных техник. Хотя ранее уже исследовались социальные и коллаборативные аспекты разработки VA-систем, практические вызовы на этапе их разработки остаются недостаточно изученными. Тем не менее, количество VA-систем возрастает, но остается ограниченным число структурированных знаний, которые могли бы подкрепить их разработку и модернизацию. Для примирения этой проблемы предлагается VA-Blueprint — методология и база знаний, которая систематически обзорит и классифицирует основные блоки VA-систем, особо значимой областью из-за сложности данных и уникальных задач. Эта подход был применен к первоначальному набору 20 систем, чтобы сформировать инициальную базу знаний и создать "синтаксис" для разработки VA-систем. Для масштабирования этого подхода, был использован глубокое обучение для автоматизации извлечения компонентов из дополнительных 81 статей (в итоге получился корпус из 101 статей), чтобы оценить эффективность метода в построении базы знаний. В итоге, этот подход позволяет лучше понять структуру VA-систем и создать базу для более структурированной, повторяемой и эффективной разработки. ## Метод Методология VA-Blueprint основывается на следующих шагах: 1. **Изучение предметной области**: Анализ и отбор систем в области визуальных анализов, особо значимых для экспертов и практиков. 2. **Классификация компонентов**: Разработка многоуровневой системы классификации, позволяющей разделить системы на базовые элементы (например, источники данных, аналитические модели, визуальные представления). 3. **Использование машинного обучения**: Использование глубокого обучения для автоматизации процесса извлечения компонентов из документов, что позволяет масштабировать базу знаний. 4. **Оценка эффективности**: Использование экспертных интервью и метрик аннотации для проверки качества работы алгоритмов. Таким образом, VA-Blueprint предлагает структурированный подход к построению визуальных аналитических систем, который может быть использован для различных сфер применения. ## Результаты Применение VA-Blueprint к первоначальному набору 20 систем позволило выделить и структурировать основные компоненты VA-систем в многоуровневую систему. Эти компоненты были потом автоматически извлечены из дополнительных 81 статей, чтобы расширить базу знаний до 101 систем. Экспертные интервью показали, что методология эффективно работает для категоризации систем и позволяет выявить потенциальные улучш

Abstract

Designing and building visual analytics (VA) systems is a complex, iterative process that requires the seamless integration of data processing, analytics capabilities, and visualization techniques. While prior research has extensively examined the social and collaborative aspects of VA system authoring, the practical challenges of developing these systems remain underexplored. As a result, despite the growing number of VA systems, there are only a few structured knowledge bases to guide their design and development. To tackle this gap, we propose VA-Blueprint, a methodology and knowledge base that systematically reviews and categorizes the fundamental building blocks of urban VA systems, a domain particularly rich and representative due to its intricate data and unique problem sets. Applying this methodology to an initial set of 20 systems, we identify and organize their core components into a multi-level structure, forming an initial knowledge base with a structured blueprint for VA system development. To scale this effort, we leverage a large language model to automate the extraction of these components for other 81 papers (completing a corpus of 101 papers), assessing its effectiveness in scaling knowledge base construction. We evaluate our method through interviews with experts and a quantitative analysis of annotation metrics. Our contributions provide a deeper understanding of VA systems' composition and establish a practical foundation to support more structured, reproducible, and efficient system development. VA-Blueprint is available at https://urbantk.org/va-blueprint.

Ссылки и действия