Federated Learning for Financial Forecasting

2509.16393v1 cs.LG, stat.AP 2025-09-24
Авторы:

Manuel Noseda, Alberto De Luca, Lukas Von Briel, Nathan Lacour

Резюме на русском

#### Контекст Финансовые рынки представляют собой сложную среду, характеризующуюся высокой нерегулярностью и неизбежной неопределенностью. Одним из ключевых задач, стоящих перед исследователями, является прогнозирование тенденций этих рынков. Несмотря на то, что искусственные нейронные сети, такие как Long Short-Term Memory (LSTM), доказали свою эффективность в этой области, использование централизованных подходов может сталкиваться с рядом проблем. Эти проблемы включают затрудненный доступ к данным из-за конфиденциальности и юридических ограничений, а также высокую стоимость централизованного обработки данных. Таким образом, необходимо развивать альтернативные подходы, которые обеспечат доступ к богатым данным, обеспечивают безопасность и сохраняют приватность. #### Метод Для расследования этих вопросов, мы применяем технологию Federated Learning (FL). В нашем исследовании используется LSTM-классификатор для бинарной классификации тенденций финансовых рынков. Рассматриваются три сценария: (i) централизованный подход, в котором все данные объединяются в единый набор для обучения, (ii) модель, обучающаяся на отдельных подмножествах данных каждого агента, и (iii) распределенная FL, где участники обмениваются только модельными обновлениями, никогда не поделясь напрямую сырыми данными. Для добавления реальности, мы вводим независимые и идентично распределенные данные (non-IID) между агентами, а также применяем методы личностной лингвистики и дифференциальной приватности. #### Результаты Наши эксперименты показывают, что Federated Learning демонстрирует такую же точность и общезначимость, как и централизованная модель, но при этом эффективнее, чем модель, обучающаяся на отдельных данных каждого агента. Мы также проверяем FL в условиях независимых и идентично распределенных данных (non-IID), когда данные у каждого агента отличаются по своим характеристикам. Добавление дополнительных финансовых признаков и использование дифференциальной приватности позволяют улучшить общую производительность системы и обеспечить более точный прогноз. #### Значимость Наше исследование продемонстрировало, что Federated Learning может быть применен в финансовой сфере для бинарной классификации тенденций финансовых рынков с успехом. Этот подход обеспечивает совместную выгоду для всех участников, не требуя обмена сырыми данными, что значительно снижает риски со стороны приватности. Благодаря FL могут быть использованы более обширные данные для прогнозирования, без необходимости централизованной обработки. Это может иметь прямое применение в таких областях, как риск-менеджмент, финансовое

Abstract

This paper studies Federated Learning (FL) for binary classification of volatile financial market trends. Using a shared Long Short-Term Memory (LSTM) classifier, we compare three scenarios: (i) a centralized model trained on the union of all data, (ii) a single-agent model trained on an individual data subset, and (iii) a privacy-preserving FL collaboration in which agents exchange only model updates, never raw data. We then extend the study with additional market features, deliberately introducing not independent and identically distributed data (non-IID) across agents, personalized FL and employing differential privacy. Our numerical experiments show that FL achieves accuracy and generalization on par with the centralized baseline, while significantly outperforming the single-agent model. The results show that collaborative, privacy-preserving learning provides collective tangible value in finance, even under realistic data heterogeneity and personalization requirements.

Ссылки и действия