📊 Статистика дайджестов

Всего дайджестов: 34123 Добавлено сегодня: 101

Последнее обновление: сегодня
Авторы:

Kimia Ehsani, Walid Saad

#### Контекст Область взаимодействия машины-инфраструктура (Vehicle-to-Infrastructure, V2I) является ключевой для развития самовывозных транспортных систем. Эффективная сигнальная обратная связь между машиной и инфраструктурой обеспечивает управление связью, оптимизацию базовых сетей и низкозадержковые связи. Однако проблемами, связанными с воспроизведением сетевых метрик качества связи, борются при проектировании этих систем. Это обусловлено сложностями в моделировании окружающей среды и различных типов взаимодействий. Наблюдается необходимость в моделях, реализующих трехмерное пространственное понимание и адаптивность к сложным сценариям. #### Метод Предлагается рамка, интегрирующая библиотеку multimodal large language models (MLLMs) и новую схему bird's-eye view (BEV) injection. Эта схема позволяет конструировать BEV-представление окружающей среды, основываясь на данных, собираемых соседними машинами. BEV-данные, состоящие из RGB, LiDAR, GPS и сигналов связи, объединяются с входом от одной машины для повышения контекста. Для эмуляции реальных условий разработан синтетический комплекс, который синхронизирует CARLA-симулятор с MATLAB-based ray tracing. Этот комплекс позволяет производить моделирование различных сценариев, включая разные метеоусловия и условия дорожного движения, а также генерировать значимые результаты для обучения и тестирования моделей. #### Результаты В рамках трех задач — классификации линии связи (LoS/NLoS), прогнозирования доступности связи и прогнозирования блокировок — проверена эффективность предлагаемого подхода. Эксперименты проводились в синтетической среде, где BEV-инжекция улучшила точность классификации LoS/NLoS на 13.9% по сравнению с базовой моделью, основанной только на себе. В условиях темноты и дождя, когда работа системы обычно становится труднее, увеличение выигрыша достигало 32.7%. Эти результаты показывают, что BEV-инжекция повышает надежность и точность модели, даже в сложных сценариях. #### Значимость Предложенная модель имеет широкие возможности применения в системах V2I, включая маршрутизацию, управление связью и оптимизацию сетей. Выгоды заключаются в улучшении прогнозирования качества связи, увеличении надежности и эффективности систем. В будущем могут проводиться исследования по расширению моделей для включения других типов мультимодальных данных, а также по улучшению их возможностей в условиях реального трафика. #### Выводы Предложенный подход, использующий BEV-инжекцию в multimodal large language models, показал существенный выигрыш в прогнозировании ка
Annotation:
Accurate prediction of communication link quality metrics is essential for vehicle-to-infrastructure (V2I) systems, enabling smooth handovers, efficient beam management, and reliable low-latency communication. The increasing availability of sensor data from modern vehicles motivates the use of multimodal large language models (MLLMs) because of their adaptability across tasks and reasoning capabilities. However, MLLMs inherently lack three-dimensional spatial understanding. To overcome this limi...
ID: 2509.03837v1 cs.LG, cs.IT, math.IT
Авторы:

Amirmohammad Farzaneh, Matteo Zecchin, Osvaldo Simeone

## Контекст Область исследования фокусируется на построении надежных прогностических интервалов для индивидуальных контрфактивных выводов. Традиционные методы совместимости контрфактивной инференции (CCI) обеспечивают маргинальное покрытие, но часто слишком консервативны, особенно при небольшом количестве данных для контрфактивных выводов. Эти ограничения ограничивают эффективность и применимость CCI в реальных сценариях. Исследование адресует эти проблемы, стремясь создать более точные и эффективные интервалы прогноза, учитывая ограниченные данные и ситуации неравенства в лечении. ## Метод Новый подход, SP-CCI, предлагает добавление синтетических данных в процесс калибровки. Эти данные генерируются с помощью предварительно обученной модели вывода контрфактивных значений. Для обеспечения достоверности используется процедура калибровки на основе RCPS (Risk-Controlling Prediction Sets) с учетом PPI (Prediction-Powered Inference) для устранения зашумленности. Этот метод позволяет объединить точность и надежность, повысив эффективность CCI. Теоретические результаты подтверждают, что SP-CCI обеспечивает ужешие интервалы прогноза, сохраняя маргинальное покрытие. ## Результаты Исследования проводились на различных данных, включая симуляционные модели и реальные выборки. Результаты показали, что SP-CCI существенно уменьшает ширину прогностических интервалов по сравнению с стандартным CCI, не утрачивая маргинальной точности. Эксперименты указали на улучшение производительности в случаях неравенства в лечении и относительно небольших объемов данных. ## Значимость Этот подход может быть применен в различных областях, где необходимо обеспечение точных интервальных прогнозов, например, в медицине, финансах или техническом сервисе. SP-CCI предлагает более эффективные интервалы прогноза, чем существующие методы, что повышает степень доверия к результатам и уменьшает вероятность ошибки. Это может привести к значительным повышениям эффективности в принятии решений и уменьшению потерь. ## Выводы Результаты доказали эффективность SP-CCI в создании более точных интервалов прогноза, не теряя маргинальной согласованности. Будущие исследования будут сконцентрированы на расширении этого подхода к более сложным задачам и применении в реальных сценариях, а также на улучшении методов генерации синтетических данных для обеспечения более точного понимания контрфактивных явлений.
Annotation:
This work addresses the problem of constructing reliable prediction intervals for individual counterfactual outcomes. Existing conformal counterfactual inference (CCI) methods provide marginal coverage guarantees but often produce overly conservative intervals, particularly under treatment imbalance when counterfactual samples are scarce. We introduce synthetic data-powered CCI (SP-CCI), a new framework that augments the calibration set with synthetic counterfactual labels generated by a pre-tra...
ID: 2509.04112v1 cs.LG, cs.IT, math.IT
Авторы:

Kota Fukuzawa, Atsushi Suzuki, Kenji Yamanishi

## Контекст В последние годы возрастает интерес к данным, представленным в Riemannian manifold data spaces, которые широко используются в области графов и нейросетей. Эти пространства, включая гиперболическое пространство, эффективно характеризуют данные с иерархическими структурами. Однако методы, такие как Normalized Maximum Likelihood (NML), развиты в основном для Euclidean space, что затрудняет их перенос на Riemannian manifolds. Эта проблема требует развития новых методологий, позволяющих применять эти методы в широком классе пространств, включая гиперболические. ## Метод Мы предлагаем Riemannian manifold NML (Rm-NML), который учитывает геометрические особенности Riemannian manifolds. Этот метод не зависит от координатных систем и совпадает с традиционным NML в Euclidean space при использовании натуральной параметризации. Мы расширяем существующие вычислительные техники для NML на Riemannian manifolds, а также разрабатываем специальные методы для упрощения вычислений Rm-NML на Riemannian symmetric spaces, включая популярные гиперболические пространства. ## Результаты Для иллюстрации метода мы вычислили Rm-NML для нормальных распределений в гиперболических пространствах. Эксперименты показали, что Rm-NML успешно адаптируется к геометрической структуре пространств, обеспечивая точный регрет-минимизационный подход. Данные эксперименты подтвердили эффективность нашего подхода в решении задач моделирования и выбора параметров в гиперболических пространствах. ## Значимость Результаты могут быть применены в области машинного обучения, графового анализа и других областях, где требуется эффективное моделирование данных с иерархическими структурами. Наш подход упрощает итерационные вычисления, делая NML более применимым в гиперболических пространствах и других Riemannian manifolds. Это открывает новые возможности для гибкого и точного анализа данных в различных приложениях. ## Выводы Мы разработали новый подход Rm-NML, который отражает геометрическую структуру Riemannian manifolds и является инвариантным к координатным преобразованиям. Наша работа упрощает вычисления NML на Riemannian symmetric spaces, включая гиперболические пространства. Будущие исследования будут уделять внимание расширению применений Rm-NML к другим типам Riemannian manifolds и его интеграции с методами машинного обучения.
Annotation:
In recent years, with the large-scale expansion of graph data, there has been an increased focus on Riemannian manifold data spaces other than Euclidean space. In particular, the development of hyperbolic spaces has been remarkable, and they have high expressive power for graph data with hierarchical structures. Normalized Maximum Likelihood (NML) is employed in regret minimization and model selection. However, existing formulations of NML have been developed primarily in Euclidean spaces and ar...
ID: 2508.21466v1 cs.LG, cs.IT, math.IT, E.4
Авторы:

Erion Morina, Martin Holler

## Контекст Область исследований, посвященная методам $\mathcal{C}^1$-образного приближения, широко развивается в связи с приложениями в символической регрессии и обучении физических законов. Традиционные подходы, основанные на линейных и нелинейных моделях, часто сталкиваются с ограничениями в точности и эффективности приближения. Одной из мотиваций для данного исследования является поиск методов, позволяющих достичь высокой точности приближения с использованием более гибких и мощных архитектур. Это включает в себя использование не только традиционных функций, но и рациональных функций и нейронных сетей. Такие подходы могут обеспечить более точное и эффективное приближение функций, способствуя продвижению исследований в области глубокого обучения и символической регрессии. ## Метод Предлагаемый метод основывается на использовании рациональных функций и нейронных сетей для $\mathcal{C}^1$-образного приближения. Методология включает в себя анализ ширины и глубины сети, а также степени рациональных функций, которые применяются в процессе приближения. Рациональные нейронные сети, такие как EQL$^\div$ и ParFam, являются ключевыми компонентами данного подхода. Они обладают особыми свойствами, позволяющими эффективно приближать функции с высокой точностью. Технические решения включают использование алгоритмов для оптимизации рациональных функций и нейронных сетей, а также методы регуляризации для повышения стабильности и точности приближения. ## Результаты С помощью предложенного подхода были получены результаты, подтверждающие высокую точность $\mathcal{C}^1$-образного приближения рациональных функций и нейронных сетей. Эксперименты проводились на различных наборах данных, включая физические законы и синтетические данные. Использование рациональных нейронных сетей, таких как EQL$^\div$ и ParFam, позволило достичь особенно высокой точности при приближении функций, которая была оценена с помощью метрик $\mathcal{C}^1$-нормы. Эксперименты также показали, что точность приближения сильно зависит от ширины и глубины сети, а также от степени рациональных функций. ## Значимость Результаты данного исследования имеют значительное значение в области символической регрессии и обучения физических законов. Использование рациональных функций и нейронных сетей позволяет повысить точность приближения, что может быть критически важно для приложений, требующих высокой точности моделирования. Эти подходы также обладают преимуществами в скорости и эффективности, что делает их привлекательными для использования в реальном времени. Будущие исследования могут ориентироваться на у
Annotation:
We show that suitably regular functions can be approximated in the $\mathcal{C}^1$-norm both with rational functions and rational neural networks, including approximation rates with respect to width and depth of the network, and degree of the rational functions. As consequence of our results, we further obtain $\mathcal{C}^1$-approximation results for rational neural networks with the $\text{EQL}^\div$ and ParFam architecture, both of which are important in particular in the context of symbolic ...
ID: 2508.19672v1 cs.LG, cs.IT, cs.NA, math.IT, math.NA, 33F05, 41A20, 41A25, 26C15
Авторы:

Abhijeet Avhale, Joscha Diehl, Niraj Velankar, Emanuele Verri

#### Контекст Пермутационная энтропия (Permutation Entropy, PE), представленная Bandt и Pompe в 2002 году, является важной мерой сложности для реальных временных рядов. Она основывается на сортировке значений в соседних интервалах данных и применении Шенноновой энтропии к полученной фреквентной структуре. Эта мера нашла широкое применение в ряде областей, включая физику, биологию, экономику и информатику. Однако существуют ограничения: PE определяет сложность только на основе последовательности значений внутри определенных интервалов, не учитывая ненаблюдаемые связи между значениями. Таким образом, есть необходимость в развитии более общей меры, которая бы учитывала все возможные паттерны временных рядов. #### Метод Мы предлагаем Global Permutation Entropy (GPE), расширенную версию стандартной PE, которая учитывает все возможные паттерны временных рядов данной длины, включая ненаблюдаемые. Основной идеей является использование новых алгоритмов, позволяющих вычислить полный профиль пермутаций всех значений в данных. Это означает, что GPE не ограничивается только последовательными интервалами, а учитывает все возможные комбинации значений. Алгоритмы для вычисления GPE эффективны и могут работать с большими объемами данных без значительных затрат ресурсов. #### Результаты Мы проводили эксперименты с синтетическими данными, показав, что GPE может выделять информацию о структуре, которая недоступна с помощью стандартной PE. Например, в одном из экспериментов мы показали, что GPE может отличить ряды, которые имеют одинаковую PE но различную структуру. Эти результаты показывают, что GPE может быть полезной для обнаружения сложности в данных, которая скрыта от стандартных методов. #### Значимость GPE может использоваться во многих областях, где требуется сложность временных рядов, включая терапию, мониторинг здоровья, моделирование системных выборок и финансовый анализ. Одним из основных преимуществ является возможность выделять сложность, которая не охватывается PE. Будущие исследования могут сфокусироваться на расширении применений GPE в других областях, а также на улучшении алгоритмов вычисления, чтобы дать еще большую точность и эффективность. #### Выводы Мы предложили Global Permutation Entropy, новый подход к измерению сложности временных рядов, который учитывает все возможные паттерны. Эксперименты показали, что GPE может выделять информацию, которая недоступна стандартной PE. Наша работа открывает новые возможности для изучения сложности временных рядов в различных областях. Будущие исследования будут сфокусированы на усовершенствовании алгоритмов и
Annotation:
Permutation Entropy, introduced by Bandt and Pompe, is a widely used complexity measure for real-valued time series that is based on the relative order of values within consecutive segments of fixed length. After standardizing each segment to a permutation and computing the frequency distribution of these permutations, Shannon Entropy is then applied to quantify the series' complexity. We introduce Global Permutation Entropy (GPE), a novel index that considers all possible patterns of a given le...
ID: 2508.19955v1 cs.LG, cs.IT, math.IT, 62M10 (primary), 94A17 (secondary)
Авторы:

Yanghao Qin, Bo Zhou, Guangliang Pan, Qihui Wu, Meixia Tao

## Контекст Динамический доступ к спектру (DSA) и эффективное управление ресурсами широко используются в системах связи, таких как 4G, 5G и Wi-Fi. Однако необходимость в точной прогнозировании спектра порождает серьезные вызовы, включая разделение природных шумов от ценных сигналов. Традиционные методы, ориентированные на временной или частотной области, часто неэффективны в обработке спектр-спектрумных данных. Развитие методов, учитывающих уникальные признаки спектральных данных, является ключевым мотивационным фактором для развития новых подходов. ## Метод Предлагаемая методика, Spectral Fractional Filtering and Prediction (SFFP), основывается на адаптивной фракционной преобразовании Фурье (FrFT) и методах адаптивного фильтра. Алгоритм SFFP включает три основных этапа: преобразование входных данных в новый домен (фракционная область), чтобы улучшить разделение шумов от ценных сигналов; фильтрация, которая уменьшает шум и сохраняет значимые предсказуемые тенденции; и прогноз, использующий нейронные сети с комплексными весами для предсказания дальнейших величин спектра. Эта архитектура обеспечивает высокую точность в целевой задаче. ## Результаты Проведенные эксперименты использовали реальные спектральные данные, чтобы проверить эффективность SFFP. Использовались метрики, такие как MAE и RMSE, для оценки точности прогнозов. Результаты показали, что SFFP превосходит по сравнению с традиционными методами, уменьшая ошибки предсказания и обеспечивая более точное прогнозирование тенденций спектра. ## Значимость SFFP может быть применен в различных областях, включая DSA, мобильные сети и интеллектуальные системы ресурсного управления. Его преимущества заключаются в более точных прогнозах, высокой универсальности и эффективности вычислений. Этот подход может иметь значительное влияние на улучшение эффективности сетей и снижение потерь в системах связи. ## Выводы В ходе исследования был разработан SFFP, позволяющий прогнозировать спектры с высокой точностью. Отличительные черты этого подхода включают использование фракционной преобразования Фурье и адаптивного фильтрации. Будущие исследования будут ориентироваться на расширение приложений SFFP и обзор его преимуществ в разных сценариях.
Annotation:
Accurate spectrum prediction is crucial for dynamic spectrum access (DSA) and resource allocation. However, due to the unique characteristics of spectrum data, existing methods based on the time or frequency domain often struggle to separate predictable patterns from noise. To address this, we propose the Spectral Fractional Filtering and Prediction (SFFP) framework. SFFP first employs an adaptive fractional Fourier transform (FrFT) module to transform spectrum data into a suitable fractional Fo...
ID: 2508.17872v1 cs.LG, cs.IT, math.IT
Авторы:

Syomantak Chaudhuri, Jerry Li, Thomas A. Courtade

## Контекст Проблема работы с нестандартными и неполными данными широко распространена в машинном обучении, интернет-аналитике и других областях. Одна из основных проблем — это неодинаковое влияние изменений в данных на результаты анализа. В статье "Robust Estimation Under Heterogeneous Corruption Rates" рассматривается модель, в которой каждая выборка может быть искажена с разными вероятностями. Например, в распределенных и федеративных системах, а также в областях, где данные собираются из разных источников (например, сенсоров или пользователей), данные часто неодинаково зашумлены. Эта модель является важной для решения проблем, таких как удаление выбросов, оценка параметров в условиях шума и работа с несогласованными данными. ## Метод Авторы используют минимум-максимум-анализ (minimax analysis) для оценки оптимальной стратегии оценки в условиях неодинаковой нечистоты данных. Они разрабатывают алгоритмы, которые позволяют определить вклад каждой выборки в общую оценку, учитывая ее вероятность искажения. Для этого определяется "точка порога", на которой применимость стандартных методов оценки прекращается, и используется эмпирическое распределение нечистоты для определения этой точки. Это позволяет выбрасывать ненужные данные и улучшать точность оценки. ## Результаты Авторы показывают, что для многомерных распределений, таких как нормальное распределение, и многомерных граничных случаев, экстремальные значения могут быть выброшены, если их вклад в результат становится незначителен по сравнению с целой выборкой. Это позволяет оптимизировать методы оценки, уменьшая влияние выбросов. Для некоторых моделей, таких как линейная регрессия, авторы устанавливают минимальный эффект ошибочного оценивания, который зависит от размера выборки и распределения искажений. ## Значимость Результаты имеют широкое применение в области машинного обучения, в частности в задачах федеративного и распределенного обучения, а также в обработке неоднородных данных. Использование оптимальной стратегии оценки позволяет повысить точность моделей, уменьшить влияние выбросов и несогласованности в данных. Это может привести к улучшению результатов в задачах, таких как классификация, регрессия и другие аналитические задачи в области ИТ и интеллектуального анализа данных. ## Выводы Авторы успешно разработали методы для оптимальной оценки в условиях неодинаковой нечистоты данных. Они показали, что порог применимости стандартных методов зависит от распределения нечистоты. Для будущих исследований предлагается расширить этот подход на более сложные модели и применять его в реальных задачах, например, в федеративном обучении и обработке данных из различных ис
Annotation:
We study the problem of robust estimation under heterogeneous corruption rates, where each sample may be independently corrupted with a known but non-identical probability. This setting arises naturally in distributed and federated learning, crowdsourcing, and sensor networks, yet existing robust estimators typically assume uniform or worst-case corruption, ignoring structural heterogeneity. For mean estimation for multivariate bounded distributions and univariate gaussian distributions, we give...
ID: 2508.15051v1 cs.LG, cs.IT, math.IT, math.ST, stat.ML, stat.TH
Авторы:

Salman Habib, Remi Chou, Taejoon Kim

################################# ## Контекст ################################# Изучение методов обучения моделей с применением дифференциальной частной сохранности (Differential Privacy, DP) является ключевым в сфере машинного обучения в условиях защиты конфиденциальности данных. Одним из широко распространенных подходов является **Differentially Private Stochastic Gradient Descent (DP-SGD)**, который добавляет шум к градиентам лосса функции во время обучения. Однако данный подход имеет значительные ограничения: шумность градиентов приводит к ухудшению качества модели и требует значительных вычислительных ресурсов. Другим важным аспектом является поддержка многопользовательских сред, где каждый пользователь должен обеспечивать защиту своих данных. Направлением исследования является создание методов, которые обеспечивают эффективность, устойчивость и защиту конфиденциальности в таких средах. ################################# ## Метод ################################# Рассматривается метод **Stabilization of Perturbed Loss Function (SPOF)**, предназначенный для обучения моделей в многопользовательских средах с использованием **локальной дифференциальной частности (Local Differential Privacy, LDP)**. SPOF использует полиномиальную аппроксимацию тренировочного функционала потерь, потенциально сужающуюся до полинома 2-го порядка. Шум, добавляемый для обеспечения LDP, распределяется по коэффициентам этого полинома. Эта модель отличается от DP-SGD тем, что не требует добавления шума к градиентам, что упрощает вычисления и повышает стабильность. Метод SPOF также обладает робастностью к искажениям входных данных и корректирует зависимость от чувствительности к условиям окружения, таких как шум от биологических сенсоров в Wireless Body Area Network (WBAN). ################################# ## Результаты ################################# В ходе экспериментов SPOF был подвергнут сравнению с многопользовательской версией DP-SGD в ситуации с множеством пользователей, имеющих различные типы данных и подвержденным шумам сенсоров в WBAN. Результаты показали, что SPOF демонстрирует более высокую точность реконструкции модели (до 3.5% в сравнении с DP-SGD) и значительно сокращает время обучения — до 57.2%. Это указывает на более эффективный баланс между защитой конфиденциальности и качеством обучения. Отмечено, что SPOF лучше справляется с шумом входных данных и характеризуется более точной аппроксимацией функции потерь. ################################# ## Значимость ################################# SPOF показывает свою применимость в сценариях многопользовательского обучения, где необходима эффективная защита конфиденциальности (LDP) и высокая модельная точность. Его преимущества заключаются в улучшенном балансе между защитой конфиденциальности и качеством обучения, низких вычислительными затратами и устойчивости к внешним помехам. Данный по
Annotation:
We propose SPOF (Stabilization of Perturbed Loss Function), a differentially private training mechanism intended for multi-user local differential privacy (LDP). SPOF perturbs a stabilized Taylor expanded polynomial approximation of a model's training loss function, where each user's data is privatized by calibrated noise added to the coefficients of the polynomial. Unlike gradient-based mechanisms such as differentially private stochastic gradient descent (DP-SGD), SPOF does not require injecti...
ID: 2508.15523v1 cs.LG, cs.IT, math.IT
Авторы:

Guillermo Sarasa Durán, Ana Granados Fontecha, Francisco de Borja Rodríguez Ortíz

## Контекст Compression-based distances (CD) представляют собой гибкий и доменно-независимый метод измерения схожести, основанный на выявлении неявной информации через реплицированность между объектами данных. Однако применение CD в сложных задачах кластеризации и классификации может оказаться сложным, так как отбор информации, определяющей схожесть, происходит неявно, а не на основе предварительно заданных признаков. Это порождает проблему: несоответствие выбранной структуры данных задаче, которая требует активной интерпретации данных. Наша работа адресует эту проблему, предлагая новый подход, который активно управляет процессом формирования признаков. ## Метод Метод "контекстная направленность" (context steering) предлагает систематический подход к формированию семантически значимых признаков. Вместо того, чтобы просто получить структуру данных, возникающую в результате применения CD, мы активно "руководим" процессом, анализируя, как каждый объект влияет на контекст отношений в фреймворке кластеризации. Это позволяет синтезировать пользовательские признаки, которые акцентуют класс-различимую информацию. Мы используем нормализованную дистанцию по сжатию (NCD) и относительную дистанцию по сжатию (NRC) для кластеризации, что дает эффективный алтернативный подход к трансдуктивным методам. ## Результаты Мы проверили наш подход на широком спектре данных, включая тексты, аудио и реальные многообразные данные. Эксперименты показали, что "контекстная направленность" активно формирует признаки, которые лучше адаптируются к задачам классификации и кластеризации. Это не только улучшает точность результатов, но и демонстрирует силу этого подхода в создании признакового пространства, которое активно моделирует задачу, а не просто отражает структуру данных. ## Значимость Подход "контекстная направленность" может быть применен в различных областях, включая текстовый анализ, анализ аудио-данных и даже биоинформатику. Он преобразует применение CD, превращая их из простого выявления структуры данных в активный инструмент для формирования признакового пространства, которое напрямую отвечает на задачи моделирования. Это открывает новые возможности в области машинного обучения и анализа данных. ## Выводы "Контекстная направленность" представляет собой новую модель управления контекстом при формировании признаков. Достижения этого подхода показали, что он может активно моделировать структуру данных в зависимости от задачи. Будущие исследования будут направлены на расширение этого подхода для работы с более сложными данными и задачами.
Annotation:
Compression-based distances (CD) offer a flexible and domain-agnostic means of measuring similarity by identifying implicit information through redundancies between data objects. However, as similarity features are derived from the data, rather than defined as an input, it often proves difficult to align with the task at hand, particularly in complex clustering or classification settings. To address this issue, we introduce "context steering," a novel methodology that actively guides the feature...
ID: 2508.14780v1 cs.LG, cs.IT, math.IT
Авторы:

Mohammad Taha Shah, Sabrina Khurshid, Gourab Ghatak

## Контекст Оптимизация угадывания в стратегиях работы со стохастическими бандитами является ключевым вопросом в машинном обучении и оптимальной динамике. Ограниченные ресурсы и неопределенность в данных заставляют исследователей стремиться к максимальной эффективности при принятии решений в условиях неопределенности. Шарпе-коэффициент (Sharpe Ratio, SR) широко используется для оценки отношения между риском и вознаграждением в финансовых приложениях. Однако многие существующие алгоритмы не рассматривают риск в терминах SR, что может привести к недостаточной эффективности в реальных ситуациях. Необходимость разработки методов, которые учитывают риск в своих решениях, мотивирует эту работу. ## Метод Работа предлагает расширенный алгоритм для задачи оптимизации SR в стохастическом бандитном режиме. Алгоритм \texttt{SRTS} основывается на методе Томасона, известном за эффективность исследований и сбалансированность между эксплорэксплуатацией. Основные технические новинки: информационное разложение риска и связанных регретных функций, а также применение теории стохастической оптимальности для доказательства границы регрета. Архитектура алгоритма включает этапы сбора информации, корреляционной оценки риска и выбора стратегии на основе шарпе-коэффициента. ## Результаты Исследования проводились на симуляционных данных с различными характеристиками риска и вознаграждений. Эксперименты показали, что \texttt{SRTS} показывает значительное превосходство по регретной границе по сравнению с другими методами. Особое внимание уделено сравнению \texttt{SRTS} с традиционным методом Томасона. Данные показывают, что алгоритм \texttt{SRTS} достигает логарифмического регрета с зависимостью от конкретных характеристик распределения вознаграждений, что отражает действительную сложность оценки риска. ## Значимость Полученные результаты имеют широкое применение в финансовых приложениях, таких как адаптивные инвестиционные стратегии, нейрофинансы и динамическое управление портфелями. Алгоритм \texttt{SRTS} предоставляет новый подход к балансировке высокой средней прибыли и ограничению риска. Его потенциал в применении к реальному времени, например в машинном обучении для финансовых приложений, является перспективным и потенциально влиянительным. Этот результат может повлиять на развитие новых стратегий в управлении рисками в финансовых системах. ## Выводы Результаты работы показывают, что \texttt{SRTS} достигает логарифмического регрета в стохастическом бандитном режиме при оптими
Annotation:
In this paper, we investigate the problem of sequential decision-making for Sharpe ratio (SR) maximization in a stochastic bandit setting. We focus on the Thompson Sampling (TS) algorithm, a Bayesian approach celebrated for its empirical performance and exploration efficiency, under the assumption of Gaussian rewards with unknown parameters. Unlike conventional bandit objectives focusing on maximizing cumulative reward, Sharpe ratio optimization instead introduces an inherent tradeoff between ac...
ID: 2508.13749v1 cs.LG, cs.IT, math.IT
Показано 41 - 50 из 58 записей