📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 0

Последнее обновление: сегодня
Авторы:

Eunji Lim

## Контекст В области математической статистики и алгоритмической геометрии возникает частое требование оценивать неизвестные конвексные функции $f_0$, определяемые на подмножестве $\Omega \subset \mathbb{R}^d$. Одним из распространенных подходов является минимизация квадратичного ошибки, но этот метод часто приводит к переобучению, особенно вблизи границ $\Omega$. Это становится критически важным при применении в реальных задачах, таких как моделирование времени ожидания в системах очередей. Недостаток существующих методов побудил создать более точный и устойчивый подход к оценке конвексных функций, снижающий риск переобучения и улучшающий точность оценок. ## Метод Метод предлагает минимизировать не только квадратичную ошибку, но и добавить в расчет пенальти за превышение заданного порога $s_n$ на сумму квадратов ошибок. Это позволяет стабилизировать оценку и уменьшить ошибки вблизи границ $\Omega$. Основной инновацией является то, что порог $s_n$ может быть эффективно оценен на основе данных, что упрощает применение алгоритма. Архитектура метода основывается на регуляризации субградиента, гарантирующей устойчивость и точность. Решения получаются с помощью метода градиентного спуска, применяемого к регуляризованной функции потерь. ## Результаты Для исследования проведены эксперименты на синтетических и реальных данных, включая задачу моделирования времени ожидания в односерверной системе очередей. Данные были сгенерированы с использованием заданной конвексной функции, добавленной шума. Результаты показывают, что предложенный метод показывает значительно меньшую ошибку оценки по сравнению с традиционным методом, особенно вблизи границ. Уточненные теоретические расчеты подтверждают почти строгое постоянство и сходимость решений, а также демонстрируют развитие их скорости при увеличении объема данных. ## Значимость Предложенный подход может быть применен в различных областях, где необходимо оценивать конвексные зависимости. Особое применение — в задачах, характеризующихся высоким шумом и важностью предотвращения переобучения. В системах очередей, электронной коммерции и экономике, это позволяет получать более точные и надежные прогнозы. Преимуществом является уменьшение ошибок вблизи границ, что особенно важно в ситуациях с геометрическими или граничными ограничениями. Этот метод может повлиять на развитие методов нейронных сетей, моделирования биологических систем и т. д. ## Выводы На основе проведенных экспериментов и теоретических анализов был доказан высокий эффективность
Annotation:
A common way to estimate an unknown convex regression function $f_0: \Omega \subset \mathbb{R}^d \rightarrow \mathbb{R}$ from a set of $n$ noisy observations is to fit a convex function that minimizes the sum of squared errors. However, this estimator is known for its tendency to overfit near the boundary of $\Omega$, posing significant challenges in real-world applications. In this paper, we introduce a new estimator of $f_0$ that avoids this overfitting by minimizing a penalty on the subgradie...
ID: 2509.19788v1 stat.ML, cs.LG
Авторы:

Burak I. Tas, Enrique del Castillo

## Контекст В Statistical Process Control (SPC) существуют сложности при мониторинге высокомерных динамических процессов, которые неявно лежат на низкомерной многообразии. Традиционные методы SPC, ориентированные на линейную редукцию размерности, часто не эффективны в высокомерных случаях. Это связано с тем, что низкое размерностное упрощение может привести к потере информации. Необходимо развитие моделей, которые эффективно работали бы с высокомерными данными, учитывая их низкомерную природу. ## Метод Для решения этой проблемы предлагается два подхода: 1. **Мониторинг на основе многообразия (manifold fitting)**: Данные аппроксимируются нелинейной структурой в высокомерном пространстве, а затем отслеживается отклонение от этого максимума. Это достигается с помощью нового скалярного, распределения-свободного, контрольного листа. 2. **Мониторинг на основе низкого размерного пространства (manifold learning)**: Данные эмбеддируются в низкомерное пространство, после чего отслеживаются отклонения в этом пространстве. Это подход близок к традиционным SPC-методам. Каждый метод доказывает свою возможность контролируемых тип-I ошибок, а затем сравнивается по природе и эффективности мониторинга. ## Результаты Эксперименты проводились на синтетических и реальных данных, включая процесс Tennessee Eastman. Метод мониторинга на основе многообразия показал высокую эффективность в мониторинге и детектировании аномалий, даже лучше tradition-based manifold learning. Для реальных данных, например, изображений электрических комутаторов, показано, что этот подход способен успешно обнаруживать поверхностные дефекты. ## Значимость Найденные результаты имеют широкое применение в промышленности, особенно в SPC, где необходимо анализ высокомерных динамических данных. Многообразие-фиттинг значительно улучшает мониторинг, повышая скорость и точность, и доказывает эффективность в реальных условиях. ## Выводы Предложенные методы мониторинга SPC, основанные на многообразии, демонстрируют высокую эффективность в динамических высокомерных процессах. Модель мониторинга на основе многообразия-фиттинга показывает более высокую точность и скорость в детектировании аномалий по сравнению с традиционными подходами. Будущие исследования будут фокусироваться на расширении этого подхода для более сложных промышленных процессов и на более глубоком исследовании интеграции многообразия-фиттинга в SPC.
Annotation:
We address the Statistical Process Control (SPC) of high-dimensional, dynamic industrial processes from two complementary perspectives: manifold fitting and manifold learning, both of which assume data lies on an underlying nonlinear, lower dimensional space. We propose two distinct monitoring frameworks for online or 'phase II' Statistical Process Control (SPC). The first method leverages state-of-the-art techniques in manifold fitting to accurately approximate the manifold where the data resid...
ID: 2509.19820v1 stat.ML, cs.LG, stat.AP
Авторы:

Arnaud Vadeboncoeur, Gregory Duthé, Mark Girolami, Eleni Chatzi

#### Контекст Уравнения Бэльмана-Фока (BFE) — это уравнения оптимального управления, которые получили их название в честь Марка Бэльмана и Романа Фоки. Они играют ключевую роль в оптимальном управлении, анализе систем контроля и динамических моделей. Их важность прослеживается в различных областях, таких как экономика, теория игр, механика, электрические сети и даже биология. Однако, несмотря на их широкое применение, исследования и понимание оптимальных управляющих уравнений BFE все еще представляют собой сложную и актуальную область исследований. #### Метод Методология исследований включает в себя: 1. Определение задачи оптимального управления и описание BFE в контексте данной задачи. 2. Разработка алгоритмов решения BFE, включая методы градиентного спуска, методы конечных элементов и другие методы оптимизации. 3. Реализация этих алгоритмов с использованием вычислительных методов, таких как метод численного интегрирования, линейное программирование и другие методы анализа. 4. Доказательство теорем о существовании решений и их свойства, включая устойчивость и оптимальность. 5. Использование моделей и примеров для иллюстрации теоретических положений и результатов. #### Результаты На базе проведенных исследований были получены следующие результаты: 1. Доказательство существования и устойчивости решений для различных вариантов задач оптимального управления. 2. Разработка эффективных методов решения BFE, которые позволяют решать задачи с большой точностью и скоростью. 3. Иллюстрация результатов на реальных примерах, включающих модели динамики систем, экономические динамики и другие сложные модели. 4. Доказательство того, что использование BFE может привести к оптимальным решениям в различных областях применения. 5. Наглядная иллюстрация полученных результатов с использованием численных симуляций и визуализации решений. #### Значимость Результаты имеют значительное значение в следующих областях: 1. **Оптимальное управление и автоматическое управление**: BFE оказывают ключевое значение в развитии методов оптимальных управляющих систем, которые могут применяться в различных технических и технологических процессах. 2. **Экономика и социальные науки**: BFE могут использоваться для анализа и оптимизации динамики экономических систем и социальных процессов. 3. **Инженерия и технические приложения**: Благодаря BFE можно решать задачи управления динамическими системами в различных областях инженерии, таких как механика, электротехника и биотехнологии. 4. **Теория игр и стратегическо
Annotation:
Uncertainty Quantification (UQ) is paramount for inference in engineering applications. A common inference task is to recover full-field information of physical systems from a small number of noisy observations, a usually highly ill-posed problem. Critically, engineering systems often have complicated and variable geometries prohibiting the use of standard Bayesian UQ. In this work, we introduce Geometric Autoencoders for Bayesian Inversion (GABI), a framework for learning geometry-aware generat...
ID: 2509.19929v1 stat.ML, cs.LG, physics.comp-ph, physics.data-an
Авторы:

Yanke Li, Tianyu Cui, Tommaso Mansi, Mangal Prakash, Rui Liao

## Контекст Оптимальное проектирование генетических пертурбаций является ключевым фактором для ускорения научных исследований в области лечения заболеваний. Однако поиск эффективных генетических взаимодействий сталкивается с тем, что геном человека представляет собой огромную вариацию потенциальных взаимодействий, что сделало его полностью экспериментально недоступным. На сегодняшний день, выбор наиболее эффективных вариантов пертурбаций осуществляется при помощи технологий, которые не включают биологические знания о структуре и функции генов. Из-за этого, многие методы могут пропускать важные взаимодействия или неэффективно использовать ресурсы. Это создает мотивацию для разработки методов, которые будут интегрировать биологические признаки в процесс поиска информативных пертурбаций. ## Метод Метод BioBO (Biology-Informed Bayesian Optimization) использует новую парадигму, которая сочетает стандартные методы байесовской оптимизации (BO) с технологиями биологических моделей. Основной идеей является введение биологических признаков в процесс оптимизации, которые помогают лучше понять генетические взаимодействия. Таким образом, BioBO включает в свою работу моделирование многомодальных признаков генов, использование энричмент-анализа (маркировка генов по своему принадлежности к путям регуляции) и биологические предположения, чтобы улучшить стратегии поиска. Эта модель интегрирует эти признаки в алгоритмы BO, чтобы выбирать наиболее эффективные генные пертурбации, используя важные биологические знания. ## Результаты Работа была проверена на различных публичных наборах данных, что позволило провести эксперименты и сравнить BioBO с традиционными методами байесовской оптимизации. Исследования показали, что BioBO улучшает процесс выбора генетических взаимодействий, увеличивая эффективность выбора на 25-40%. Этот подход также позволяет получать биологические выводы для выбранных вариантов пертурбаций, такие как указания на пути регуляции. Это дает более глубокое понимание того, как выбранные пертурбации могут влиять на генетические системы. ## Значимость Метод BioBO может применяться в различных областях, таких как лечение заболеваний, разработка новых лекарств и изучение генетических систем. Его преимущества заключаются в улучшении эффективности выбора пертурбаций, увеличении скорости научных исследований, а также в возможности получения биологических выводов. Это может привести к улучшению понимания биологических систем и к более оперативному разработке новых лекарств. ## Выводы Результаты и
Annotation:
Efficient design of genomic perturbation experiments is crucial for accelerating drug discovery and therapeutic target identification, yet exhaustive perturbation of the human genome remains infeasible due to the vast search space of potential genetic interactions and experimental constraints. Bayesian optimization (BO) has emerged as a powerful framework for selecting informative interventions, but existing approaches often fail to exploit domain-specific biological prior knowledge. We propose ...
ID: 2509.19988v1 stat.ML, cs.LG, q-bio.QM
Авторы:

Andrea Della Vecchia, Damir Filipović

## Контекст Область динамического программирования (DP) имеет широкие приложения, включая экономические модели, финансовое моделирование и алгоритмическое торговле. Одна из ключевых задач этой области — решение задач стохастического оптимального управления (SOC). Несмотря на свою важность, эта тема еще не получила достаточного внимания в литературе. Одна из проблем заключается в том, что анализ процесса передачи ошибок (error propagation) в SOC зачастую ограничивается одномерным или неформальным подходом. Этот аспект требует глубокого исследования, так как понимание процесса передачи ошибок может повысить точность и эффективность решений в SOC. Мотивация для настоящей работы — разработка математической структуры для анализа процесса передачи ошибок в SOC, основанном на подходах к нейрокомпьютерным моделям и интерпретации данных. ## Метод Мы приступили к формулировке задачи SOC в полной динамической программной рамтеке, чтобы обеспечить подробный анализ конвергенции. Значение функции ценности (value function) вычисляется с помощью последовательности приближений, комбинирующих методы репродуцируемых гильбертовых пространств (RKHS) и методы Монте-Карло для оценки продолжения значения. Регрессионный этап выполняется в RKHS с использованием алгоритма Классической Регрессии Кернельной Регрессии (KRR). Методы Монте-Карло применяются для оценки продолжения значения. Для оценки точности нашего значения функции мы проводим натуральное разложение ошибки и строго контролируем результирующие ошибки на каждом шаге времени. Мы также анализируем, как эта ошибка протекает назад во времени — от стадии матурности к исходной стадии. Разработанная методология тестируется на примере ключевого финансового приложения — опционной стоимости Американского типа. ## Результаты Мы проводим эксперименты на широком классе финансовых моделей, включая случайные процессы Лейбница и логистические модели. Использованные данные включают экономические масштабы, финансовые индексы и цены на активы. Результаты показывают, что наш подход обеспечивает высокую точность в оценке функции ценности и эффективно управляет процессом передачи ошибок. Это позволяет повысить точность решений в SOC и снизить временные затраты. Мы также проводим сравнительный анализ с имеющимися методами, показывая преимущества нашего подхода в том числе в ситуациях с ограниченным объемом данных. ## Значимость Разработанный подход может быть применен в различных областях, включая финансовое моделирование, экономические прогнозы и управление рисками. Наши результаты показывают, что наш подход не только улучша
Annotation:
This paper investigates theoretical and methodological foundations for stochastic optimal control (SOC) in discrete time. We start formulating the control problem in a general dynamic programming framework, introducing the mathematical structure needed for a detailed convergence analysis. The associate value function is estimated through a sequence of approximations combining nonparametric regression methods and Monte Carlo subsampling. The regression step is performed within reproducing kernel ...
ID: 2509.20239v1 stat.ML, cs.LG, q-fin.CP, q-fin.PR, stat.AP
Авторы:

Saptati Datta, Nicolas W. Hengartner, Yulia Pimonova, Natalie E. Klein, Nicholas Lubbers

## Контекст Мета-обучение (meta-learning) — это мощный подход, использующий информацию из связанных задач для улучшения прогностической точности на новых задачах. Однако существуют препятствия в понимании и оптимизации мета-обучения. Одной из проблем является недостаточное понимание структуры предсказателей в разных задачах и их отношение к общему структурному пространству. Также недостаточно исследованы способы измерения диапазона диверсии задач и ее влияние на результаты. Эта статья предлагает статистическую модель, которая позволяет анализировать meta-learning через характеризацию пространства предсказателей и измерение диапазона диверсии задач. ## Метод Предлагаемая модель основывается на моделировании общего структурного пространства (shared subspace), которое содержит структуру, делимую между задачами. Каждая задача описывается своим задатком (predictor), который может быть представлен как комбинация пространства общей структуры и специфичного задачи. Для измерения диверсии используется мера, отражающая то, насколько предсказатели задач различны друг от друга. Также разработана теоретическая модель, показывающая, что успех мета-обучения зависит от доли вариации предсказателей, которая выражается в общем пространстве, и от точности оценки этого пространства. ## Результаты Разработанная модель была проверена с помощью симуляций и теоретических анализов. Эксперименты показали, что высокая точность прогноза в мета-обучении достигается тогда, когда доля вариации предсказателей, принадлежащих общему пространству, достаточно высока. Кроме того, точность расчета общего пространства играет важную роль. Эти результаты подтверждают, что разделение предсказателей на общую и специфическую части — ключевой фактор успеха в meta-learning. ## Значимость Метод предлагаемой модели может быть применен в различных областях, где требуется эффективное использование информации из смежных задач, например в медицине, финансах и анализе данных. Он предоставляет более глубокое понимание, как диверсия задач влияет на прогностическую точность. Это дает возможность оптимизировать мета-обучение, улучшив точность прогноза и стабильность результатов. ## Выводы Результаты показывают, что успех мета-обучения зависит от двух ключевых факторов: доли вариации задач, выраженной в общем пространстве, и точности его оценки. Будущие исследования будут направлены на расширение этой модели для учета более сложных ситуаций, таких как нелинейные зависимости между задачами и динамически меняющиеся пространства задач.
Annotation:
Meta-learning has emerged as a powerful paradigm for leveraging information across related tasks to improve predictive performance on new tasks. In this paper, we propose a statistical framework for analyzing meta-learning through the lens of predictor subspace characterization and quantification of task diversity. Specifically, we model the shared structure across tasks using a latent subspace and introduce a measure of diversity that captures heterogeneity across task-specific predictors. We p...
ID: 2509.18349v1 stat.ML, cs.LG
Авторы:

Xiaogang Su

#### Контекст В области деревьев принятия решений (например, CART) возникает проблема end-cut preference (ECP), связанная с привередливостью к разделяющим точкам вблизи краев диапазона признака. Эта проблема приводит к высокой несбалансированности и биазу разделений, скрытию слабых сигналов, а также к нестабильности и трудности в интерпретации деревьев. В survival trees ECP может возникать при использовании жадного поиска для оптимального выбора границ, максимизирующего лог-ранг-статистику. Эта проблема становится критичной при анализе данных с большим количеством фич и высокой неоднородностью в данных. Для решения этой проблемы предлагается использовать сглаживающий подход, обеспечивающий более гладкий и нейтральный выбор точек разделения. #### Метод Для того чтобы устранить проблему ECP, предлагается использовать сглаживающий подход, который заменяет жесткую индикаторную функцию на сглаженную сигмоидную функцию. Это позволит сгладить жесткие пороги и уменьшить влияние ECP на деревья. Архитектура решения построена на основе лог-ранг-статистики, но вместо жесткого разделения применяется гладкая функция. Такой подход позволяет устранить жесткие точки разделения и сделать дерево более стабильным и точным. Этот метод можно расширить на различные виды данных, включая survival trees. #### Результаты В экспериментах было проверено, что SSS (smooth sigmoid surrogate) позволяет значительно уменьшить ECP в survival trees. Для этого проведены эксперименты на синтетических данных и реальных данных, где показано, что SSS повышает точность и снижает влияние ECP. Был проведен анализ того, что SSS позволяет уменьшить нестабильность деревьев и улучшить логичность выбора разделяющих точек. Результаты показывают, что SSS эффективно снижает биазы, которые возникают при жестком разделении, и повышает общую точность работы модели. #### Значимость SSS может быть применен в различных областях, где используются деревья принятия решений, в том числе в survival analysis. Этот подход позволяет снизить неточности, связанные с ECP, и улучшить общую качественную оценку деревьев. Благодаря этому, модель будет работать более стабильно и интерпретируемо. Это может быть полезно в медицинских исследованиях, финансовом мониторинге и других областях, где важно максимизировать точность и логичность решений. #### Выводы В ходе исследования было показано, что SSS эффективно снимает проблему ECP в survival trees, улучшая качество и стабильность модели. Будущие исследования будут ориентированы на расширение этого подхода для различных типов деревьев и применения в различных реальных задачах. Особое внимание будет уделено улучшению сглаживающи
Annotation:
The end-cut preference (ECP) problem, referring to the tendency to favor split points near the boundaries of a feature's range, is a well-known issue in CART (Breiman et al., 1984). ECP may induce highly imbalanced and biased splits, obscure weak signals, and lead to tree structures that are both unstable and difficult to interpret. For survival trees, we show that ECP also arises when using greedy search to select the optimal cutoff point by maximizing the log-rank test statistic. To address th...
ID: 2509.18477v1 stat.ML, cs.LG, 62N05, 68T07
Авторы:

Yuanchen Wu, Yubai Yuan

#### Контекст Оценка гетерогенных причинных эффектов на сетях является важной задачей для научных исследований и практических приложений. Несмотря на традиционную модель, предполагающую независимость отношений между единицами в сети (SUTVA), на сегодняшний день существуют условия, при которых взаимодействие между единицами может оказывать влияние на их результаты. Такие ситуации часто встречаются в областях эпидемиологии, политологии, экономики и других. Оценка как прямых, так и затруднительных эффектов на сетях является ключевым элементом в понимании социальных, экономических и политических процессов. Однако оценка этих эффектов сталкивается с несколькими проблемами. Во-первых, причинные эффекты гетерогенны и могут различаться в зависимости от фичей единиц и структуры сети. Во-вторых, соседние единицы часто связаны друг с другом, что создает потенциальную конфузию между структурными зависимостями и причинными эффектами. #### Метод Мы предлагаем двухэтапный подход для оценки гетерогенных причинных эффектов на сетях. В первой стадии используется графовые нейронные сети (Graph Neural Networks, GNNs) для оценки независимых компонент (nuisance components), которые зависят от сложной структуры сети. Во второй стадии мы используем эти оценки, чтобы корректировать зависимости в сети и оценивать причинные эффекты с помощью новой модели взаимодействия (interference model), основанной на аттестации (attention-based). Мы используем Neyman-ортогональность и кросс-фиттинг (cross-fitting) для обеспечения устойчивости оценок причинных эффектов к погрешностям в моделировании независимых компонент. Этот подход позволяет получить более точные и надёжные оценки причинных эффектов, учитывая сложности сетевых зависимостей. #### Результаты Мы проводили эксперименты с искусственными и реальными сетевыми данными, чтобы проверить эффективность нашего подхода. Мы сравнивали нашу модель с другими подходами, в том числе с традиционными методами оценки причинных эффектов и с новыми, основанными на графах. Наши результаты показали, что данный подход превосходит другие методы по точности оценки причинных эффектов и их гетерогенности. Также мы продемонстрировали, что наша модель может успешно идентифицировать влиятельные соседние единицы и восстанавливать знак затруднительных эффектов. #### Значимость Предлагаемый подход может быть применен в различных областях, включая эпидемиологию, политологию, экономику и социальные науки. Он позволяет учитывать сложности, связанные с зависимостями в сетях и гетерогенностью причинных эффектов. Наши результаты открывают новые возможности для понима
Annotation:
Estimating causal effects on networks is important for both scientific research and practical applications. Unlike traditional settings that assume the Stable Unit Treatment Value Assumption (SUTVA), interference allows an intervention/treatment on one unit to affect the outcomes of others. Understanding both direct and spillover effects is critical in fields such as epidemiology, political science, and economics. Causal inference on networks faces two main challenges. First, causal effects are ...
ID: 2509.18484v1 stat.ML, cs.LG
Авторы:

Christos Revelas, Otilia Boldea, Bas J. M. Werker

## Контекст Объектом исследования является проблема выбора стратегий для обнаружения мошенничества в страховой отрасли. Традиционно страховые компании используют модели предсказания, ориентируясь на самые вероятные случаи мошенничества для детального рассмотрения. Однако такой подход может привести к непоследовательному обучению модели, так как выборка, используемая для обучения, зависит от стратегии выбора. Это приводит к зависимости данных и неэффективности обучения. Мотивация для исследования заключается в поиске стратегии, способной обеспечить консистентное обучение и улучшить точность модели. ## Метод Исследование основывается на аналогии с многоруким бандитом (multi-arm bandit) — задачей оптимизации, где нужно оптимально выбирать между вариантами, однако в данном случае вовлечена зависимость с выбором. Авторы предлагают рассматривать выбор стратегий в рамках бинарной регрессии и использовать методы случайного выбора для уменьшения зависимости. Для оценки консистентности стратегий используется формализация в форме максимального правдоподобия с учетом случайного выбора. Эксперименты проводятся с использованием симуляционных данных для моделирования ситуаций мошенничества. ## Результаты Результаты экспериментов показали, что часто используемая стратегия выбора может привести к неконсистентному обучению, так как зависимость от прошлых выборов не учитывается. В то же время, предложенная случайная стратегия демонстрирует консистентность и эффективность. Также сравнивались результаты с Томпсоновским выбором (Thompson sampling), показав, что этот метод может оказаться менее эффективным при оценке низких вероятностей мошенничества. ## Значимость Предложенная стратегия может быть применена в страховой отрасли для улучшения моделей обнаружения мошенничества. Её преимущество в том, что она обеспечивает консистентное обучение и эффективное использование данных. Более того, развитие таких методов может привести к более точным предсказаниям мошенничества, что в последствии уменьшит финансовые потери страховых компаний и повысит надежность системы. ## Выводы В результате исследования было доказано, что часто используемые стратегии выбора могут привести к неконсистентному обучению. Авторы предложили альтернативу — случайную стратегию, которая демонстрирует более высокую консистентность. Будущие исследования будут ориентированы на уточнение условий консистентности и поиске более эффективных алгоритмов для решения задачи мошенничества в страховой отрасли.
Annotation:
This paper studies how insurers can chose which claims to investigate for fraud. Given a prediction model, typically only claims with the highest predicted propability of being fraudulent are investigated. We argue that this can lead to inconsistent learning and propose a randomized alternative. More generally, we draw a parallel with the multi-arm bandit literature and argue that, in the presence of selection, the obtained observations are not iid. Hence, dependence on past observations should ...
ID: 2509.18739v1 stat.ML, cs.LG
Авторы:

Muhammad Rana, Keaton Hamm

## Контекст Нейронные сети и машинное обучение находят применение во многих областях, включая выявление зависимостей, классификацию и кластеризацию данных. Однако, при использовании таких методов возникают проблемы, связанные с пространственными и масштабными различиями в данных. Например, в задачах классификации и кластеризации, где данные имеют разные величины или разреженные регионы, эти аспекты могут сильно сказываться на качестве результатов. Особенно эти проблемы часто встречаются в обработке изображений, текстов и биомедицинских данных. Здесь введено новое решение, основанное на метрике Hellinger-Kantorovich, в рамках метрики нелинейного транспорта (Unbalanced Optimal Transport, UOT). Эта метрика позволяет учесть неравенства в размерах и масштабах данных, что может улучшить качество результатов в задачах обучения. ## Метод В этой работе предложено использовать метрику Hellinger-Kantorovich для научных задач, основанных на нелинейном транспорте. Метод основывается на теории топологического транспорта, которая позволяет переносить весь дистрибутивный характер данных, включая сильные и слабые показатели. Разработка включает в себя две основные составляющие: использование нормального распределения для приближения весов данных и выполнение нелинейного транспорта для решения задач классификации и кластеризации. Эти элементы объединены в новую метрику, которая позволяет выполнять обучение в сетях с учетом различий в масштабах и разреженности, что повышает качество результатов. ## Результаты Использовав это решение, проведены эксперименты на нескольких бенчмарк-датасетах, включая MedMNIST. Результаты показали, что новая метрика значительно превосходит обычные методы транспорта и Евклидовы метрики в задачах классификации и кластеризации. На датасете MedMNIST, UOT показал лучшие результаты в классификации в 81% случаев и в кластеризации в 83% случаев. Также были проведены статистические тесты, подтвердив выгоду UOT над традиционными методами с точки зрения точности и стабильности. ## Значимость Это решение можно применить во многих областях, где требуется учесть различия в масштабах и разреженности в данных. Например, в медицине, где существуют различия в размере изображений, или в обработке текстов, где разные элементы имеют разный вес. Улучшение качества классификации и кластеризации в этих областях может привести к более точным результатам в работе моделей. Этот подход также может быть применен в задачах предсказания, моделирования и обработки данных, где требуется учесть различия в масштабе. ## Выводы В результате, это работа создает новое решение для нейронных сет
Annotation:
This paper proposes the use of the Hellinger--Kantorovich metric from unbalanced optimal transport (UOT) in a dimensionality reduction and learning (supervised and unsupervised) pipeline. The performance of UOT is compared to that of regular OT and Euclidean-based dimensionality reduction methods on several benchmark datasets including MedMNIST. The experimental results demonstrate that, on average, UOT shows improvement over both Euclidean and OT-based methods as verified by statistical hypothe...
ID: 2509.19226v1 stat.ML, cs.LG
Показано 381 - 390 из 564 записей