Synthesizing Behaviorally-Grounded Reasoning Chains: A Data-Generation Framework for Personal Finance LLMs
2509.14180v1
cs.CL, cs.AI, cs.LG, 68T50, I.2.7; J.4
2025-09-19
Авторы:
Akhil Theerthala
Резюме на русском
## Контекст
Одним из ключевых вопросов в области искусственных нейронных сетей является развитие моделей, способных эффективно решать задачи в области финансового планирования. На сегодняшний день существуют модели, которые могут давать финансовые рекомендации, оптимизировать бюджеты или анализировать денежные потоки, но они либо требуют высокой стоимости обучения, либо не учитывают цели и особенности пользователя. Из-за этого есть необходимость в развитии более персонализированных моделей, которые могут учитывать такие факторы, как личные цели, ограничения, риск-толерерантность и юридический контекст. В статье представлен фреймворк, который объединяет финансовую область и психологические характеристики пользователя для создания данных, необходимых для тренировки моделей.
## Метод
В этом исследовании предлагается фреймворк, который использует методы глубокого обучения для создания данных, которые могут использоваться для обучения моделей финансового генеративного моделирования. Основной идеей является интеграция финансовой контекстной информации с поведенческими моделями, чтобы формировать подходящие входные данные для моделей. Для этого используется парадигма сгенерированных данных, которая позволяет моделям решать задачи, связанные с финансовым планированием или бюджетированием. Такая модель способна предсказывать решения, которые будут гораздо более точными, чем те, которые генерируются без учета контекста. Эта модель также позволяет снизить затраты на обучение сетей, так как она требует меньше данных и ресурсов для обучения.
## Результаты
Для проверки работы предложенного фреймворка был создан 19 к больших данных с примерами решения задач финансового планирования. Эти данные были использованы для обучения модели Qwen-3-8B. Также проведены эксперименты, в ходе которых была проверена модель на задаче решения финансовых проблем пользователей. В результате получено, что модель Qwen-3-8B, обученная на этом датасете, показала хорошие результаты в плане точности, грамматической функциональности и персонализации ответов. Модель показала себя на уровне с моделями, имеющими значительно большие параметры (14-32B), но с меньшей стоимостью обучения.
## Значимость
Предложенный фреймворк может быть применен в различных сферах, где необходимо отвечать на финансовые вопросы, таких как бюджетирование, оптимизация затрат, дебт-менеджмент, пенсионное планирование и т.д. Модель показывает высокую точность и персонализацию ответов, что делает ее привлекательной для широкого круга пользователей. Благодаря этой модели можно создавать более эффективные и пер
Abstract
Personalized financial advice requires consideration of user goals,
constraints, risk tolerance, and jurisdiction. Prior LLM work has focused on
support systems for investors and financial planners. Simultaneously, numerous
recent studies examine broader personal finance tasks, including budgeting,
debt management, retirement, and estate planning, through agentic pipelines
that incur high maintenance costs, yielding less than 25% of their expected
financial returns. In this study, we introduce a novel and reproducible
framework that integrates relevant financial context with behavioral finance
studies to construct supervision data for end-to-end advisors. Using this
framework, we create a 19k sample reasoning dataset and conduct a comprehensive
fine-tuning of the Qwen-3-8B model on the dataset. Through a held-out test
split and a blind LLM-jury study, we demonstrate that through careful data
curation and behavioral integration, our 8B model achieves performance
comparable to significantly larger baselines (14-32B parameters) across factual
accuracy, fluency, and personalization metrics while incurring 80% lower costs
than the larger counterparts.