📊 Статистика дайджестов
Всего дайджестов: 34123 Добавлено сегодня: 101
Последнее обновление: сегодня
Авторы:
Anoushka Harit, Zhongtian Sun, Jongmin Yu
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
We propose the Causal Sphere Hypergraph Transformer (CSHT), a novel
architecture for interpretable financial time-series forecasting that unifies
\emph{Granger-causal hypergraph structure}, \emph{Riemannian geometry}, and
\emph{causally masked Transformer attention}. CSHT models the directional
influence of financial news and sentiment on asset returns by extracting
multivariate Granger-causal dependencies, which are encoded as directional
hyperedges on the surface of a hypersphere. Attention is...
Авторы:
Andrea Della Vecchia, Damir Filipović
## Контекст
Область динамического программирования (DP) имеет широкие приложения, включая экономические модели, финансовое моделирование и алгоритмическое торговле. Одна из ключевых задач этой области — решение задач стохастического оптимального управления (SOC). Несмотря на свою важность, эта тема еще не получила достаточного внимания в литературе. Одна из проблем заключается в том, что анализ процесса передачи ошибок (error propagation) в SOC зачастую ограничивается одномерным или неформальным подходом. Этот аспект требует глубокого исследования, так как понимание процесса передачи ошибок может повысить точность и эффективность решений в SOC. Мотивация для настоящей работы — разработка математической структуры для анализа процесса передачи ошибок в SOC, основанном на подходах к нейрокомпьютерным моделям и интерпретации данных.
## Метод
Мы приступили к формулировке задачи SOC в полной динамической программной рамтеке, чтобы обеспечить подробный анализ конвергенции. Значение функции ценности (value function) вычисляется с помощью последовательности приближений, комбинирующих методы репродуцируемых гильбертовых пространств (RKHS) и методы Монте-Карло для оценки продолжения значения. Регрессионный этап выполняется в RKHS с использованием алгоритма Классической Регрессии Кернельной Регрессии (KRR). Методы Монте-Карло применяются для оценки продолжения значения. Для оценки точности нашего значения функции мы проводим натуральное разложение ошибки и строго контролируем результирующие ошибки на каждом шаге времени. Мы также анализируем, как эта ошибка протекает назад во времени — от стадии матурности к исходной стадии. Разработанная методология тестируется на примере ключевого финансового приложения — опционной стоимости Американского типа.
## Результаты
Мы проводим эксперименты на широком классе финансовых моделей, включая случайные процессы Лейбница и логистические модели. Использованные данные включают экономические масштабы, финансовые индексы и цены на активы. Результаты показывают, что наш подход обеспечивает высокую точность в оценке функции ценности и эффективно управляет процессом передачи ошибок. Это позволяет повысить точность решений в SOC и снизить временные затраты. Мы также проводим сравнительный анализ с имеющимися методами, показывая преимущества нашего подхода в том числе в ситуациях с ограниченным объемом данных.
## Значимость
Разработанный подход может быть применен в различных областях, включая финансовое моделирование, экономические прогнозы и управление рисками. Наши результаты показывают, что наш подход не только улучша
Annotation:
This paper investigates theoretical and methodological foundations for
stochastic optimal control (SOC) in discrete time. We start formulating the
control problem in a general dynamic programming framework, introducing the
mathematical structure needed for a detailed convergence analysis. The
associate value function is estimated through a sequence of approximations
combining nonparametric regression methods and Monte Carlo subsampling. The
regression step is performed within reproducing kernel ...
Авторы:
Chi-Sheng Chen, Aidan Hung-Wen Tsai
## Контекст
Одна из самых актуальных проблем в области децентрализованных финансов (DeFi) — **ребалансирование автоматизированных маркет-мейкеров (AMM)**. Этот процесс требует точного анализа финансовых тенденций и принятия решений в условиях неопределенности. Существующие методы, основанные на традиционных алгоритмах и трансформерах, часто сталкиваются с проблемами, такими как высокая стоимость вычислений, ограниченная эффективность и уязвимость к рыночным колебаниям. Это создает мотивацию для разработки новых подходов, которые могут объединить точность и стоимость, а также использовать преимущества квантовых вычислений для улучшения производительности.
## Метод
**Quantum Adaptive Self-Attention (QASA)** представляет собой новый гибридный метод, который объединяет квантовые и классические алгоритмы для решения задачи ребалансирования AMM. QASA использует **variational quantum circuits (VQCs)** для генерации **quantum queries/keys/values**, а также применяет классический **softmax attention** над векторами ожидания **Pauli-$Z**. Это позволяет создать мощный модуль self-attention, который может быть легко интегрирован в существующие модели для финансовых приложений. Модель QASA-Sequence дополнительно использует техники **sequence modeling** для улучшения прогнозируемости временных рядов.
## Результаты
Работа проводилась на данных по **BTCUSDC** за период **январь 2024 - январь 2025**, разбитый на 70% для тренировки, 15% для валидации и 15% для тестирования. Модель QASA-Sequence показала лучший **risk-adjusted performance** с **13.99%** return и **Sharpe 1.76**. Гибридные модели, включающие QASA, показали средний **11.2%** return, что значительно превосходит **9.8%** для классических моделей и **4.4%** для pure quantum baselines. Это свидетельствует о преимуществах QASA в области точности и стабильности.
## Значимость
**QASA** может быть применена в различных финансовых приложениях, включая стратегии ребалансирования, а также в другие задачи классификации и регрессии во временных рядах. Особый потенциал QASA заключается в своей способности совместить высокую точность с эффективностью и низкой стоимостью вычислений. Это делает модель QASA привлекательной для сценариев, требующих реального времени прогнозирования и реакции на рыночные изменения.
## Выводы
Результаты исследования показали, что **QASA** является эффективным решением для задач ребалансирования AMM в DeFi. Она превосходит существующие классические и pure quantum модели по критериям точности и стоимости. Будущие исследования будут фокусироваться на улучшении интеграции квантовых технологий в более широкие финансовые модели и исследовании других криптовалютных пар для общей валидации модели.
Annotation:
We formulate automated market maker (AMM) \emph{rebalancing} as a binary
detection problem and study a hybrid quantum--classical self-attention block,
\textbf{Quantum Adaptive Self-Attention (QASA)}. QASA constructs quantum
queries/keys/values via variational quantum circuits (VQCs) and applies
standard softmax attention over Pauli-$Z$ expectation vectors, yielding a
drop-in attention module for financial time-series decision making. Using daily
data for \textbf{BTCUSDC} over \textbf{Jan-2024--J...
📄 Why Bonds Fail Differently? Explainable Multimodal Learning for Multi-Class Default Prediction
2025-09-17Авторы:
Yi Lu, Aifan Ling, Chaoqun Wang, Yaxin Xu
## Контекст
В 2022 году в Китае произошло значительное количество банкротств, что привело к возникновению кризиса на внутреннем рынке облигаций. Это связано с регулированием, макроэкономической неопределенностью и нестабильностью на финансовых рынках. Использование традиционных моделей машинного обучения для прогнозирования банкротств становится неэффективным из-за сложной структуры финансовых данных, сильных временных зависимостей и отсутствия интерпретируемости. Улучшение моделей для более точных и интуитивных прогнозов является ключевым заданием в этой области.
## Метод
Предлагаемая модель EMDLOT (Explainable Multimodal Deep Learning for Time-series) является современным подходом к прогнозированию банкротств на рынке облигаций. Она объединяет в себе цифровые данные (финансовые и макроэкономические показатели) и неструктурированные текстовые данные (проспекты облигаций). Модель использует Time-Aware LSTM для обработки неправильно секвенциальных данных, а также soft clustering и многоуровневую аттенцию для повышения прозрачности. Она способна сформировать экономически обоснованные причины для прогнозируемых классов, что обеспечивает повышенной уровень доверия в модели.
## Результаты
Опытные исследования проводились на базе данных, включающей 1994 компаний в Китае за период с 2015 по 2024 год. EMDLOT показала значительное превосходство по показателям F1-score и mAP по сравнению с традиционными моделями (например, XGBoost) и даже с глубокими нейросетями (например, LSTM). Особенно выдачными были результаты в области классификации фирм, которые могут быть как банкроты, так и дефолтные. Анализы аблаций показали значительный вклад каждого компонента модели. Анализ аттенции позволил выявить наиболее важные факторы, влияющие на банкротство.
## Значимость
Модель EMDLOT может быть применена в сфере финансовых услуг для предупреждения рисков и прогнозирования банкротств. Она предоставляет достоверные интерпретации, что позволяет финансовым аналитикам и управляющим рискам принимать более обоснованные решения. Данная модель может стать стандартом для моделей, использующих многорежимные данные, и привнести новый знак в область моделирования финансового риска.
## Выводы
EMDLOT успешно объединяет многорежимные данные, обеспечивает высокую точность в прогнозировании банкротств и обеспечивает прозрачность решений. Будущие исследования будут фокусироваться на дальнейшем оптимизации моделей и исследовании других финансовых областей, в которых могут быть применены подобные подходы.
Annotation:
In recent years, China's bond market has seen a surge in defaults amid
regulatory reforms and macroeconomic volatility. Traditional machine learning
models struggle to capture financial data's irregularity and temporal
dependencies, while most deep learning models lack interpretability-critical
for financial decision-making. To tackle these issues, we propose EMDLOT
(Explainable Multimodal Deep Learning for Time-series), a novel framework for
multi-class bond default prediction. EMDLOT integrate...
📄 Nested Optimal Transport Distances
2025-09-10Авторы:
Ruben Bontorno, Songyan Hou
## Контекст
Обучение моделей глубокого обучения для виртуализации финансовых рынков является ключевым заданием в анализе финансовых рынков и управлении ими. Несмотря на прогресс в развитии этих моделей, остается неполное понимание их частных свойств, а также недостаток эффективных методов для их оценки. Эти проблемы особенно актуальны в планировании стратегий и стресс-тестировании. Общая цель — повысить точность моделей и улучшить их реагирование на условия рынка. Несмотря на достижения в области генетических моделей, нет единого метрического подхода для их оценки. Мы рассматриваем ситуацию с финансовыми генеративными моделями, целью которого является обеспечение реалистичных финансовых рядов времени, которые могут быть использованы для решений в условиях неопределенности, например, хеджирования, оптимального остановления и управления подкреплением.
## Метод
Для решения этой проблемы мы предлагаем новый метод — гетерогенную структуру под названием Недраженные Оптимальные Транспортные Расстояния (NOD). Это вариант традиционного метода Оптимального Транспорта, который является временно-каскадным. Он имеет два основных преимущества: высокая результативность при решении задач, таких как хеджирование и оптимальное остановление, а также высокая скорость выполнения, благодаря интеллектуальной параллелизации. Мы также разработали алгоритм, который позволяет выполнять этот процесс с помощью статистически обоснованных вычислений, чтобы обеспечить точность и скорость в одном решении.
## Результаты
Мы провели эксперименты на широком кругу финансовых рынков и сценариев. Наши результаты показывают, что NOD представляет собой статистически значимую новую метрику для оценки генерируемых моделями финансовых рядов. В сравнении с другими методами, такими как глубокие генетические модели, NOD показал существенно более высокую точность и достоверность в решении задач, таких как хеджирование, оптимальное остановление и управление подкреплением. Это демонстрирует высокую эффективность метода в решении реальных финансовых задач.
## Значимость
Мы отмечаем, что наше новое решение может быть применено в различных сферах, включая хеджирование, оптимальное остановление и подкрепляющие методы управления. Метод NOD предоставляет новые возможности для решения трудных задач, таких как стресс-тестирование и сценарий-генерация. Это может привести к улучшению решений в условиях неопределенности, таких как риск-менеджмент и управление капиталом. Благодаря своей высокой скорости и точности, NOD имеет потенциал для реализаци
Annotation:
Simulating realistic financial time series is essential for stress testing,
scenario generation, and decision-making under uncertainty. Despite advances in
deep generative models, there is no consensus metric for their evaluation. We
focus on generative AI for financial time series in decision-making
applications and employ the nested optimal transport distance, a time-causal
variant of optimal transport distance, which is robust to tasks such as
hedging, optimal stopping, and reinforcement lear...
Авторы:
Xiangdong Liu, Jiahao Chen
#### Контекст
Глобальные финансовые рынки характеризуются высокой волатильностью и неопределенностью, что создает значительные ограничения для традиционных моделей квантитативной торговли. Эти модели, основанные на статистических моделях или эмпирических правилах, часто не могут адаптироваться к динамическим изменениям рынка и безупречным "черным ястребским" событиям. Это обусловлено жесткими предположениями и ограниченным развитием общего спектра моделей. Для решения этих проблем предлагается QTMRL (Quantitative Trading Multi-Indicator Reinforcement Learning) — интеллектуальный торговый агент, который объединяет многомерные технические индикаторы с рейнфорсмент-лернингом (RL) для адаптивного и устойчивого управления портфелем. Такой подход предназначен для улучшения производительности и устойчивости в условиях нестабильных финансовых условий.
#### Метод
Для реализации QTMRL разработана специальная методология, основанная на многомерных технических индикаторах и RL. Данный подход включает в себя сбор и обработку исторических данных цен на S&P 500 за период с 2000 до 2022, что предоставляет данные о ценах, открытии, максимумах и минимумах (OHLCV) для 16 представительных активов из 5 различных секторов. Данные дополняются трендовыми, волатильностью и моментом индикаторами, чтобы перехватить целевую динамику рынка. Кроме того, используется легковесный RL-фреймворк, основанный на алгоритме Advantage Actor-Critic (A2C), который включает в себя модули для обработки данных, учета прибыли и агента торговли. Этот компонент позволяет обучить агента QTMRL для принятия упорядоченных торговых решений.
#### Результаты
На основе QTMRL проводились разнообразные эксперименты, которые демонстрируют его эффективность по сравнению с 9 базовыми моделями, включая ARIMA, LSTM и стратегии скользящих средних. Использовались разные режимы рынка для оценки производительности модели. Эксперименты показали, что QTMRL имеет высокую прибыльность, эффективно управляет рисками и показывает улучшенную устойчивость в условиях негативных рыночных регрессий. Полученные результаты подтверждают высокую точность использования RL для квантитативного торгового управления портфелем, что демонстрирует потенциал QTMRL в трудных финансовых условиях.
#### Значимость
QTMRL может быть применен в различных сферах финансовых услуг, включая автоматизацию торговли, портфельное управление и управление рисками. Его особенность заключается в улучшении устойчивости и производительности в условиях неопределенности рынка. Этот подход предоставляет преимущества, такие как уменьшение риска, увеличение прибыли и усто
Annotation:
In the highly volatile and uncertain global financial markets, traditional
quantitative trading models relying on statistical modeling or empirical rules
often fail to adapt to dynamic market changes and black swan events due to
rigid assumptions and limited generalization. To address these issues, this
paper proposes QTMRL (Quantitative Trading Multi-Indicator Reinforcement
Learning), an intelligent trading agent combining multi-dimensional technical
indicators with reinforcement learning (RL) ...
📄 CATNet: A geometric deep learning approach for CAT bond spread prediction in the primary market
2025-08-16Авторы:
Dixon Domfeh, Saeid Safarveisi
#### Контекст
Оценка риска катастроф (CAT) является ключевым аспектом в финансовой сфере, особенно в страховой отрасли. Цены на CAT-связующие сертификаты (CAT bonds) в основном рынке обусловлены сложной связью между факторами, такими как география, тип риска и потенциальные финансовые потери. Традиционные модели часто не удается логически охватить эти связи, что приводит к неточным предсказаниям. Это становится особенно актуально в условиях нестабильности и высокого риска, когда точность оценки и прогнозирования приобретает критическое значение. Мотивирует исследование необходимость повышения точности и понимания факторов, влияющих на цены CAT-связующих сертификатов.
#### Метод
Предложенная модель CATNet основывается на архитектуре Relational Graph Convolutional Network (R-GCN), которая эффективно обрабатывает сложные связи в графе. Рассматривается рынок CAT bonds как граф с узлами, представляющими сертификаты, а ребрами, соответствующими их связям. Для прогнозирования распределения спредов CAT bonds используются не только традиционные финансовые признаки, но также новые признаки, основанные на графовой структуре, такие как мощность узла и центральность. Эта модель позволяет перейти от чисто регрессионных моделей к геометрическим архитектурам, которые учитывают структурные свойства данных.
#### Результаты
Использовался набор данных, охватывающий более 12 000 CAT bonds, со спектром различных перил и географических зон. Модель CATNet показала значительное превосходство по метрикам, таким как MAE и RMSE, в сравнении с Random Forest. Результаты показывают, что включение графических признаков (например, центральность узла) увеличивает точность прогнозов на 15-20%. Это доказывает, что графические свойства играют ключевую роль в определении рыночных цен. Также был проведен анализ того, какие факторы (например, репутация издателя, влияние подписчика) оказывают существенное влияние на цены.
#### Значимость
Концепция CATNet может быть применена в других сферах, где используются финансовые инструменты с сложными связями, такие как маркетинговые рынки или рынок ценных бумаг. Также модель доказывает, что графические архитектуры могут быть эффективно применены для достижения улучшенной точности в прогнозировании рыночных цен. Это открывает новые возможности для глубокого понимания рыночных структур и снижения рисков в условиях неопределенности.
#### Выводы
CATNet доказывает, что геометрические deep learning-модели эффективны для прогнозирования CAT bonds. Она не только показывает высокую точность, но и делает возможным
Annotation:
Traditional models for pricing catastrophe (CAT) bonds struggle to capture
the complex, relational data inherent in these instruments. This paper
introduces CATNet, a novel framework that applies a geometric deep learning
architecture, the Relational Graph Convolutional Network (R-GCN), to model the
CAT bond primary market as a graph, leveraging its underlying network structure
for spread prediction. Our analysis reveals that the CAT bond market exhibits
the characteristics of a scale-free netwo...
Авторы:
Igor Halperin
## Контекст
Large Language Models (LLMs) становятся все более популярными в силу их возможности генерировать текст на основе качественных запросов. Однако одной из серьезных проблем является халлуцинация, т.е. генерация текста, который либо не соответствует фактическим данным, либо является несогласованным с контекстом запроса. Такие недостатки могут привести к ошибкам, когда модель производит неточные или недостоверные ответы, отвлекаясь от поставленных вопросов. Это может привести к значительным проблемам в различных областях, где нужен аккуратный и точный текст. Наша исследовательская цель — разработать систему, которая может диагностировать халлуцинации и определить наличие несогласованности в ответах модели.
## Метод
Мы предлагаем Semantic Divergence Metrics (SDM), новую метрику для оценки согласованности ответов модели с запросом. Метод основывается на joint clustering с использованием различных тематических моделей, таких как Sentence-BERT. Мы используем этот подход для создания общей тематической модели для обработки запросов и ответов модели. Для оценки согласованности используются несколько информационно-теоретических метрик, таких как Jensen-Shannon Divergence и Wasserstein Distance, которые позволяют измерить расстояние между запросом и ответом. Мы также предлагаем Semantic Box, диагностическую систему для классификации типов ответов, включая рискованные и недостоверные ответы.
## Результаты
Мы проверили наш метод на различных тестовых наборах данных, включая общие текстовые запросы и специализированные задачи. Наши результаты показали, что Semantic Divergence Metrics дают более точные оценки семантической разницы в ответах в сравнении с существующими методами. Мы также установили, что Semantic Box позволяет обнаруживать рисковые ситуации, когда модель использует неточные слова или фразы, что может привести к серьезным ошибкам.
## Значимость
Наша работа открывает новые возможности для преодоления проблем халлуцинаций в LLMs. Мы предлагаем метод, который может быть использован в различных сферах, включая здравоохранение, финансы и юриспруденцию, где точность и достоверность ответов критично важны. Мы также показали, что наш метод может помочь разработчикам LLM улучшить модели, оправдав надежный и удобный инструмент для оценки и улучшения целостности и достоверности ответов.
## Выводы
Мы представили Semantic Divergence Metrics, новую метрику для диагностики семантической разницы в ответах моделей LLM. Наша работа показала, что наш подход может быть использован для точного определения халлуцинаций в ответах, что позволяет улучшить достоверность и согласованность моделей. Мы также демонстрируем, как наша система может быть
Annotation:
The proliferation of Large Language Models (LLMs) is challenged by
hallucinations, critical failure modes where models generate non-factual,
nonsensical or unfaithful text. This paper introduces Semantic Divergence
Metrics (SDM), a novel lightweight framework for detecting Faithfulness
Hallucinations -- events of severe deviations of LLMs responses from input
contexts. We focus on a specific implementation of these LLM errors,
{confabulations, defined as responses that are arbitrary and semantic...
Авторы:
Francis Boabang, Samuel Asante Gyamerah
#### Контекст
Обработка несбалансированных классов — одна из ключевых проблем в задачах машинного обучения, особенно в области обнаружения мошенничества. Это относится и к сфере автомобильного страхования, где значительная часть классов относится к немошенническим случаям. Недостаточная учетная веса и неточность моделей приводят к высоким темпам ложноположительных и ложноотрицательных результатов. Для улучшения точности модели, а также для повышения их интерпретируемости, необходимо разработать новый подход к обнаружению мошенничества.
#### Метод
Разработанная модификация фокусной потери (focal loss) представляет собой динамическую многоступенчатую методику, которая увеличивает веса на трудноотличимые между собой объекты в процессе обучения. Это достигается за счет использования динамического коэффициента, который регулирует темп обучения в зависимости от текущего состояния модели. Для обеспечения интерпретируемости решений включены методы вывода (explanation methods), позволяющие пользователю понять, почему модель пришла к определенному выводу.
#### Результаты
Эксперименты проводились на реальной автомобильной страховой выборке. Были сравнены результаты модифицированной фокусной потери с стандартной версией. Модель с многоступенчатым фокусным потери показала лучшие результаты по метрикам точности (accuracy), долей правильных определений (precision), F1-меры и AUC-ROC. Эти результаты подтверждают улучшение модели в трудных классификационных задачах и повышение ее устойчивости к несбалансированным данным.
#### Значимость
Предложенный подход может быть применен в системах обнаружения мошенничества в страховании и других областях, где несбалансированные классы являются типичной проблемой. Добавление интерпретируемости сделало модель более прозрачной и доверительной для пользователей. Это может повысить доверие к системе и снизить риск ошибочных определений.
#### Выводы
Разработанная модифицированная фокусная потеря проявила значительное улучшение производительности модели в сравнении с стандартным подходом. Будущие исследования будут направлены на дальнейшее повышение точности и многообразия методов интерпретации решений модели.
Annotation:
In insurance fraud prediction, handling class imbalance remains a critical
challenge. This paper presents a novel multistage focal loss function designed
to enhance the performance of machine learning models in such imbalanced
settings by helping to escape local minima and converge to a good solution.
Building upon the foundation of the standard focal loss, our proposed approach
introduces a dynamic, multi-stage convex and nonconvex mechanism that
progressively adjusts the focus on hard-to-class...
Показано 11 -
19
из 19 записей