When Deep Learning Fails: Limitations of Recurrent Models on Stroke-Based Handwriting for Alzheimer's Disease Detection
2508.03773v1
eess.IV, cs.AI, cs.CV
2025-08-09
Авторы:
Emanuele Nardone, Tiziana D'Alessandro, Francesco Fontanella, Claudio De Stefano
Резюме на русском
Обнаружение болезни Альцгеймера (AD) часто требует дорогостоящих нейроимажирований или инвазивных процедур, что снижает доступность диагностики. В данном исследовании исследовались возможности глубокого обучения для нейроинвазивной диагностики AD на основе анализа рукописи. Использовался датасет из 34 заданий по рукописи, собранных у здоровых участников и пациентов с AD. Здесь предлагается подход, в котором рекуррентные нейронные сети (LSTM, GRU, RNN) обучаются на предварительно извлеченных признаках рисунков, а не на непрерывных временных сигналах. Это нарушает основное предположение рекуррентных сетей о непрерывном потоке данных. Исследование показало, что рекуррентные архитектуры сталкиваются с повышенной вариабельностью и недостаточной специфичностью. Точность рекуррентных архитектур оказалась значительно ниже, чем у традиционных методов машинного обучения, которые показали лучший баланс между точностью и метриками обобщаемости. Научная статья подчеркивает ограниченность рекуррентных моделей при работе с дискретными признаками рукописи и выделяет направления для будущих исследований.
Abstract
Alzheimer's disease detection requires expensive neuroimaging or invasive
procedures, limiting accessibility. This study explores whether deep learning
can enable non-invasive Alzheimer's disease detection through handwriting
analysis. Using a dataset of 34 distinct handwriting tasks collected from
healthy controls and Alzheimer's disease patients, we evaluate and compare
three recurrent neural architectures (LSTM, GRU, RNN) against traditional
machine learning models. A crucial distinction of our approach is that the
recurrent models process pre-extracted features from discrete strokes, not raw
temporal signals. This violates the assumption of a continuous temporal flow
that recurrent networks are designed to capture. Results reveal that they
exhibit poor specificity and high variance. Traditional ensemble methods
significantly outperform all deep architectures, achieving higher accuracy with
balanced metrics. This demonstrates that recurrent architectures, designed for
continuous temporal sequences, fail when applied to feature vectors extracted
from ambiguously segmented strokes. Despite their complexity, deep learning
models cannot overcome the fundamental disconnect between their architectural
assumptions and the discrete, feature-based nature of stroke-level handwriting
data. Although performance is limited, the study highlights several critical
issues in data representation and model compatibility, pointing to valuable
directions for future research.
Ссылки и действия
Дополнительные ресурсы: