Defining and Benchmarking a Data-Centric Design Space for Brain Graph Construction

2508.12533v1 cs.LG, cs.AI, q-bio.NC 2025-08-20
Авторы:

Qinwen Ge, Roza G. Bayrak, Anwar Said, Catie Chang, Xenofon Koutsoukos, Tyler Derr

Резюме на русском

## Контекст Область исследований, связанная с построением графов мозга (brain graphs) из изображений функциональной магнитной резонансной томографии (fMRI), широко используется в графовых методах машинного обучения для нейроимминджинга. Однако, существующие подходы часто ограничиваются строгими и заранее заданными процессами, которые не учитывают важные вопросы, связанные с выбором данных и применением методов. Отсутствие гибкости в этих аспектах может привести к снижению качества результатов. Данная работа привлекла к своему основному фокусу перспективы Data-Centric AI, чтобы систематически определить и оценить пространство дизайна, связанное с построением графов мозга, с отклонением от модельно-центрических подходов, которые предшествовали. Наша цель заключается в том, чтобы проанализировать влияние различных данных и технических решений на точность классификации. ## Метод Методология исследования основывается на систематизации дизайн-пространства, связанного с построением графов мозга, и его разделении на три этапа: **обработка временных сигналов**, **экстракция топологии** и **графовая фичеризация**. Мы проводим эксперименты с использованием двух датасетов: HCP1200 и ABIDE. Наша методика включает в себя исследование стратегий, таких как фильтрация высокочастотных сигналов, стратегии спарсинга и объединения топологии, а также использование альтернативных метрик корреляции и много birds-eye view-подходов для включения локальных динамик. Мы не стремимся к разработке новых методов, а вместо этого оцениваем интеракцию существующих методов и модификаций для улучшения результатов. ## Результаты Проведенные эксперименты показали, что данные, строго оптимизированные на стадиях обработки, топологии и фичеризации, позволяют значительно улучшить точность классификации по сравнению с традиционными подходами. На датасете HCP1200, использование специально экстрагированных и фильтрованных данных привело к улучшению точности в несколько процентов. Аналогичные результаты были получены на ABIDE, где обработка данных с учетом многоуровневой топологии и многогранных фичей дала значительный прирост. Эти результаты указывают на важность тщательной настройки каждого этапа построения графов мозга и подчеркивают значимость выбора данных. ## Значимость Результаты этого исследования имеют большое значение для области нейроимминджинга, где графы мозга используются для диагностики, мониторинга и исследования различных расстройств мозга. Наш подход, ориентированный на данные, показал, что улучшение качества данных и точности стратегий подбора мо

Abstract

The construction of brain graphs from functional Magnetic Resonance Imaging (fMRI) data plays a crucial role in enabling graph machine learning for neuroimaging. However, current practices often rely on rigid pipelines that overlook critical data-centric choices in how brain graphs are constructed. In this work, we adopt a Data-Centric AI perspective and systematically define and benchmark a data-centric design space for brain graph construction, constrasting with primarily model-centric prior work. We organize this design space into three stages: temporal signal processing, topology extraction, and graph featurization. Our contributions lie less in novel components and more in evaluating how combinations of existing and modified techniques influence downstream performance. Specifically, we study high-amplitude BOLD signal filtering, sparsification and unification strategies for connectivity, alternative correlation metrics, and multi-view node and edge features, such as incorporating lagged dynamics. Experiments on the HCP1200 and ABIDE datasets show that thoughtful data-centric configurations consistently improve classification accuracy over standard pipelines. These findings highlight the critical role of upstream data decisions and underscore the importance of systematically exploring the data-centric design space for graph-based neuroimaging. Our code is available at https://github.com/GeQinwen/DataCentricBrainGraphs.

Ссылки и действия

Связанные статьи

Mentality: A Mamba-based Approach towards Foundation Models for EEG

#### Контекст Электроэнцефалография (EEG) является фундаментальным инструментом в диагностике нозологий неврологическог...

2025-09-05

Fast weight programming and linear transformers: from machine learning to neurob...

## Контекст Область исследования, охватывающая искусственные нейронные сети (АНС), сфокусирована на развитии моделей, эф...

2025-08-14