Trading-R1: Financial Trading with LLM Reasoning via Reinforcement Learning
2509.11420v1
q-fin.TR, cs.AI, cs.CE, cs.CL, cs.LG
2025-09-17
Авторы:
Yijia Xiao, Edward Sun, Tong Chen, Fang Wu, Di Luo, Wei Wang
Резюме на русском
## Контекст
Финансовые рынки требуют от моделей ИИ высокую точность, гибкость и интерпретируемость. Несмотря на развитие моделей типа LLM, возникает проблема недостаточной структурированности их выводов. Большинство существующих моделей не могут обеспечить детальный рассуждающий анализ, адекватный потребностям финансовых профессионалов. Этот вызов становится еще актуальнее в контексте необходимости сбалансированного риск-рейтинга и высокой точности. Требуется модель, которая применяла бы структурированный рассуждающий подход, включая факт-гаунтированный анализ, логическую модель риска и волатильность, чтобы обеспечить инвесторам более основательные инвестиционные решения.
## Метод
Trading-R1 представляет собой финансово направленную модель, которая применяет структурированный рассуждающий подход для генерирования инвестиционных тезисов. Модель обучается с помощью супервизированного fine-tuning и реинфорсментного обучения с использованием сложности постепенного тренировочного процесса с тремя стадиями. Для тренировки используется Tauric-TR1-DB, база данных с 100 тысяч выборок, охватывающих 18 месяцев, 14 эквити и пять видов финансовых данных. Эта модель предназначена для генерирования структурированных инвестиционных тезисов, основанных на логической модели риска, факт-гаунтированном анализе и волатильности.
## Результаты
Trading-R1 была экспериментально протестирована на шести различных акциях и ETF. Проведенные эксперименты показали, что модель предлагает значительные улучшения в risk-adjusted returns и lower drawdowns, в сравнении с open-source, proprietary instruction-following и различными reasoning models. Модель также продемонстрировала улучшенную способность генерировать структурированные, основанные на доказательствах инвестиционные тезисы.
## Значимость
Trading-R1 может быть применена в разнообразных финансовых сферах, включая risk assessment, trading strategy development, и investment research. Она предоставляет более точный, интерпретируемый подход к финансовым решениям, что может повысить уровень доверия инвесторов и снизить риски. В будущем, эта модель может стать основой для развития систем, которые могут принимать более обоснованные инвестиционные решения.
## Выводы
Trading-R1 доказала свою эффективность в создании структурированных инвестиционных тезисов, основанных на логическом анализе и факт-гаунтированных данных. Она предлагает новый подход к финансовому моделированию, который может быть использован для улучшения стратегий инвестирования и обеспечения более низких рисков. Будущие исследования будут ориентированы на дальнейшее улучшение модели, включая рас
Abstract
Developing professional, structured reasoning on par with human financial
analysts and traders remains a central challenge in AI for finance, where
markets demand interpretability and trust. Traditional time-series models lack
explainability, while LLMs face challenges in turning natural-language analysis
into disciplined, executable trades. Although reasoning LLMs have advanced in
step-by-step planning and verification, their application to risk-sensitive
financial decisions is underexplored. We present Trading-R1, a
financially-aware model that incorporates strategic thinking and planning for
comprehensive thesis composition, facts-grounded analysis, and
volatility-adjusted decision making. Trading-R1 aligns reasoning with trading
principles through supervised fine-tuning and reinforcement learning with a
three-stage easy-to-hard curriculum. Training uses Tauric-TR1-DB, a 100k-sample
corpus spanning 18 months, 14 equities, and five heterogeneous financial data
sources. Evaluated on six major equities and ETFs, Trading-R1 demonstrates
improved risk-adjusted returns and lower drawdowns compared to both open-source
and proprietary instruction-following models as well as reasoning models. The
system generates structured, evidence-based investment theses that support
disciplined and interpretable trading decisions. Trading-R1 Terminal will be
released at https://github.com/TauricResearch/Trading-R1.