Trading-R1: Financial Trading with LLM Reasoning via Reinforcement Learning

2509.11420v1 q-fin.TR, cs.AI, cs.CE, cs.CL, cs.LG 2025-09-17
Авторы:

Yijia Xiao, Edward Sun, Tong Chen, Fang Wu, Di Luo, Wei Wang

Резюме на русском

## Контекст Финансовые рынки требуют от моделей ИИ высокую точность, гибкость и интерпретируемость. Несмотря на развитие моделей типа LLM, возникает проблема недостаточной структурированности их выводов. Большинство существующих моделей не могут обеспечить детальный рассуждающий анализ, адекватный потребностям финансовых профессионалов. Этот вызов становится еще актуальнее в контексте необходимости сбалансированного риск-рейтинга и высокой точности. Требуется модель, которая применяла бы структурированный рассуждающий подход, включая факт-гаунтированный анализ, логическую модель риска и волатильность, чтобы обеспечить инвесторам более основательные инвестиционные решения. ## Метод Trading-R1 представляет собой финансово направленную модель, которая применяет структурированный рассуждающий подход для генерирования инвестиционных тезисов. Модель обучается с помощью супервизированного fine-tuning и реинфорсментного обучения с использованием сложности постепенного тренировочного процесса с тремя стадиями. Для тренировки используется Tauric-TR1-DB, база данных с 100 тысяч выборок, охватывающих 18 месяцев, 14 эквити и пять видов финансовых данных. Эта модель предназначена для генерирования структурированных инвестиционных тезисов, основанных на логической модели риска, факт-гаунтированном анализе и волатильности. ## Результаты Trading-R1 была экспериментально протестирована на шести различных акциях и ETF. Проведенные эксперименты показали, что модель предлагает значительные улучшения в risk-adjusted returns и lower drawdowns, в сравнении с open-source, proprietary instruction-following и различными reasoning models. Модель также продемонстрировала улучшенную способность генерировать структурированные, основанные на доказательствах инвестиционные тезисы. ## Значимость Trading-R1 может быть применена в разнообразных финансовых сферах, включая risk assessment, trading strategy development, и investment research. Она предоставляет более точный, интерпретируемый подход к финансовым решениям, что может повысить уровень доверия инвесторов и снизить риски. В будущем, эта модель может стать основой для развития систем, которые могут принимать более обоснованные инвестиционные решения. ## Выводы Trading-R1 доказала свою эффективность в создании структурированных инвестиционных тезисов, основанных на логическом анализе и факт-гаунтированных данных. Она предлагает новый подход к финансовому моделированию, который может быть использован для улучшения стратегий инвестирования и обеспечения более низких рисков. Будущие исследования будут ориентированы на дальнейшее улучшение модели, включая рас

Abstract

Developing professional, structured reasoning on par with human financial analysts and traders remains a central challenge in AI for finance, where markets demand interpretability and trust. Traditional time-series models lack explainability, while LLMs face challenges in turning natural-language analysis into disciplined, executable trades. Although reasoning LLMs have advanced in step-by-step planning and verification, their application to risk-sensitive financial decisions is underexplored. We present Trading-R1, a financially-aware model that incorporates strategic thinking and planning for comprehensive thesis composition, facts-grounded analysis, and volatility-adjusted decision making. Trading-R1 aligns reasoning with trading principles through supervised fine-tuning and reinforcement learning with a three-stage easy-to-hard curriculum. Training uses Tauric-TR1-DB, a 100k-sample corpus spanning 18 months, 14 equities, and five heterogeneous financial data sources. Evaluated on six major equities and ETFs, Trading-R1 demonstrates improved risk-adjusted returns and lower drawdowns compared to both open-source and proprietary instruction-following models as well as reasoning models. The system generates structured, evidence-based investment theses that support disciplined and interpretable trading decisions. Trading-R1 Terminal will be released at https://github.com/TauricResearch/Trading-R1.

Ссылки и действия