THEME : Enhancing Thematic Investing with Semantic Stock Representations and Temporal Dynamics
2508.16936v1
q-fin.PM, cs.AI, cs.CL, cs.IR
2025-08-27
Авторы:
Hoyoung Lee, Wonbin Ahn, Suhwan Park, Jaehoon Lee, Minjae Kim, Sungdong Yoo, Taeyoon Lim, Woohyung Lim, Yongjae Lee
Резюме на русском
## Контекст
Тематическое инвестирование стремится формировать портфели, соответствующие структурным трендам, однако выбор соответствующих активов остается сложным из-за перекрывающихся границ отраслей и динамических изменений рынка. Эти трудности ограничивают эффективность темытологических инвестиций. Тем самым, необходимо разработать методы, позволяющие лучше понять связи между темами и активами, а также учитывать изменения рынка. Такой подход позволит повысить качество портфелей и их рисково-вознаграждаемые характеристики.
## Метод
Мы предлагаем Thematic Representation Set (TRS) — расширенный набор данных, который использует реальные тематические ETF и дополняется индустриальными классификациями и финансовыми новостными данными. TRS обеспечивает точное определение тематических связей между активами и подробные текстовые профили для каждого актива. На основе TRS мы предлагаем \textsc{THEME}, фреймворк на основе градиентного взвешивания, который строит вложенные семантические и временные модели. Этот фреймворк позволяет лучше идентифицировать тематические связи между активами и учитывать динамику рынка.
## Результаты
Мы проверили \textsc{THEME} на нескольких метриках реализации, включая точность, долгосрочную стабильность и риск. Наши результаты показывают, что \textsc{THEME} превышает существующие методы в несколько показателей. Эти результаты демонстрируют, что \textsc{THEME} не только избегает ложных срабатываний, но и обеспечивает более точное понимание тематических связей.
## Значимость
Тематическое инвестирование имеет широкое применение в построении портфелей стратегических инвестиций. Метод \textsc{THEME} позволяет улучшить точность выбора активов, учитывая тематические связи и влияние динамики рынка. Это может привести к более эффективным портфелям с уменьшенными рисками и высокими возможностями роста.
## Выводы
Мы доказали, что \textsc{THEME} эффективно решает проблему выбора активов в тематическом инвестировании. Наш подход может быть расширен на другие ситуации, где требуется точное понимание семантических связей и временных данных. Наша работа открывает пути для будущих исследований в области адаптивных методов для инвестиционных стратегий.
Abstract
Thematic investing aims to construct portfolios aligned with structural
trends, yet selecting relevant stocks remains challenging due to overlapping
sector boundaries and evolving market dynamics. To address this challenge, we
construct the Thematic Representation Set (TRS), an extended dataset that
begins with real-world thematic ETFs and expands upon them by incorporating
industry classifications and financial news to overcome their coverage
limitations. The final dataset contains both the explicit mapping of themes to
their constituent stocks and the rich textual profiles for each. Building on
this dataset, we introduce \textsc{THEME}, a hierarchical contrastive learning
framework. By representing the textual profiles of themes and stocks as
embeddings, \textsc{THEME} first leverages their hierarchical relationship to
achieve semantic alignment. Subsequently, it refines these semantic embeddings
through a temporal refinement stage that incorporates individual stock returns.
The final stock representations are designed for effective retrieval of
thematically aligned assets with strong return potential. Empirical results
show that \textsc{THEME} outperforms strong baselines across multiple retrieval
metrics and significantly improves performance in portfolio construction. By
jointly modeling thematic relationships from text and market dynamics from
returns, \textsc{THEME} provides a scalable and adaptive solution for
navigating complex investment themes.