📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 0

Последнее обновление: сегодня

📄 Additive Distributionally Robust Ranking and Selection

2025-09-12

Авторы:

Zaile Li, Yuchen Wan, L. Jeff Hong

## Контекст Ranking and selection (R&S) — это подход, используемый для выбора оптимального альтернативного решения среди $k$ вариантов на основе их средних показателей производительности. Этот подход чрезвычайно важен для решения задач, требующих точного моделирования входных переменных. Однако это моделирование часто сталкивается с проблемой нехватки данных, что приводит к неопределенности ввода (curse of input uncertainty). Дистрибутивно robust ranking and selection (DRR&S) предлагает решение этой проблемы, используя неопределенность ввода через амбигуозный набор $m > 1$ допустимых распределений. Это приводит к $km$ сценариям, которые должны быть рассмотрены в процессе выбора. Недавние исследования DRR&S показали, что эффективность алгоритма крайне зависит от добротной аллокации ресурсов. Тем не менее, основные свойства такой аллокации, такие как ее согласованность и форма, остаются неясными. Настоящая работа основывается на этом понятии, предлагая новый подход к решению R&S-задач. ## Метод Мы предлагаем простую аллокационную процедуру (Additive Allocation, AA), которая направлена на увеличение эффективности R&S-процедур. Эта процедура призвана оптимально распределять ресурсы, ограничиваясь проблематичными $k + m - 1$ сценариями, которые могут быть критичными для выбора. Мы используем аргументы о пересечениях границ (boundary-crossing arguments) для доказательства производительности этого подхода. Кроме того, мы доказываем, что процедура AA обладает свойством согласованности и достигает добротности в смысле добавления: при увеличении ресурсов только $k + m - 1$ сценариев будут рассматриваться бесконечно часто. Это свойство нарушает предыдущие убеждения о критичности некоторых сценариев. Для улучшения практической эффективности мы предлагаем General Additive Allocation (GAA), которая интегрирует модульные правила выбора из традиционных R&S-процедур. ## Результаты Мы проводили эксперименты, используя различные симуляционные модели и наборы данных, чтобы проверить функционирование предложенных алгоритмов. Наши эксперименты подтвердили, что Additive Allocation позволяет достичь значительной экономии ресурсов, сохранив точность выбора оптимального варианта. GAA продемонстрировала улучшенную универсальность и гибкость, адаптируясь к различным условиям задачи. Наши результаты показали, что процедура AA не только эффективна, но и противоречит предыдущим предположениям о критичности некоторых сценариев. ## Значимость Наш подход может быть применен в различных областях, где необходимо выбирать оптимальные решения на основе симуляционных моделей. Например, в экономике, инженерии и медицине DRR&S используется для моделирования рисков и выбора лучших

Annotation:

Ranking and selection (R&S) aims to identify the alternative with the best mean performance among $k$ simulated alternatives. The practical value of R&S depends on accurate simulation input modeling, which often suffers from the curse of input uncertainty due to limited data. Distributionally robust ranking and selection (DRR&S) addresses this challenge by modeling input uncertainty via an ambiguity set of $m > 1$ plausible input distributions, resulting in $km$ scenarios in total. Recent DRR&S ...

ID: 2509.06147v1 stat.ML, cs.LG, stat.ME

arXiv PDF

📄 Asynchronous Gossip Algorithms for Rank-Based Statistical Methods

2025-09-12

Авторы:

Anna Van Elst, Igor Colin, Stephan Clémençon

## Контекст Одним из ключевых вопросов, связанных с развитием децентрализованных систем AI и edge intelligence, является обеспечение их надежности и устойчивости в условиях распределенных вычислений, особенно при наличии поврежденных или адверсарных данных. Обычные децентрализованные алгоритмы чувствительны к сбоям и контamination данных, т.к. они обычно оперируют простыми статистическими показателями, такими как среднее или сумма. Из-за этого в последнее время возникла необходимость развития более надежных методов, ориентированных на работу в таких условиях. В связи с этим, в последнее время активно исследуются распределенные алгоритмы, основывающиеся на вычислении рангов и других отказоустойчивых статистических методов. Наша работа следует этой тенденции, призванной развить асинхронные алгоритмы для вычисления различных rank-based statistics, включая L-statistics и Wilcoxon rank-sum tests. ## Метод Мы разработали асинхронный gossip-алгоритм для вычисления большого класса rank-based statistics, включая L-statistics и rank-based statistics, которые известны своей устойчивостью к выбросам. Наша методология основывается на распределенном вычислении, где узлы обмениваются своими значениями в течение нескольких шагов. Для расчета rank-based statistics применяется асинхронная модель, где каждый узел вычисляет свои значения независимо от других узлов, используя локальные данные и общий обмен информацией. Мы также применяем нашу модель к решению задачи дистрибьюционного теста гипотез, в том числе Wilcoxon rank-sum test, что является первым применением такого подхода в этой области. Мы доказали теоретическую устойчивость нашего алгоритма и оценили его скорость сойдения к точному решению. ## Результаты Мы провели эксперименты на различных топологиях сетей, включая звездообразные и циркулярные структуры, и сравнили наш алгоритм с существующими алгоритмами. Наши результаты показали, что асинхронный gossip-алгоритм вы mostrado, что асинхронный gossip-алгоритм показывает лучшую точность и устойчивость в сравнении с другими подходами, особенно в условиях разрушенных данных. Мы также подтвердили теоретические результаты, полученные в ходе экспериментов, что демонстрирует эффективность нашего подхода в распределенных системах. ## Значимость Наш подход может быть применён в различных областях, где требуется отказоустойчивость и надежность в распределенных вычислениях, например, в Интернете вещей (IoT), децентрализованных системах AI, и медицине. Наши методы позволяют повысить надежность распределенных систем, уменьшив влияние поврежденных данных. Благодаря их устойчивости к выбросам и высокой точности, они могут быть использованы в широком кругу приложений, таки

Annotation:

As decentralized AI and edge intelligence become increasingly prevalent, ensuring robustness and trustworthiness in such distributed settings has become a critical issue-especially in the presence of corrupted or adversarial data. Traditional decentralized algorithms are vulnerable to data contamination as they typically rely on simple statistics (e.g., means or sum), motivating the need for more robust statistics. In line with recent work on decentralized estimation of trimmed means and ranks, ...

ID: 2509.07543v2 stat.ML, cs.LG

arXiv PDF

📄 kNNSampler: Stochastic Imputations for Recovering Missing Value Distributions

2025-09-12

Авторы:

Parastoo Pashmchi, Jerome Benoit, Motonobu Kanagawa

## Контекст Отсутствие данных в незавершенных или урезанных решеток является одной из наиболее распространенных проблем в обработке данных. Эти пропуски могут привести к значительной потере точности в моделировании и анализе. Одним из популярных подходов к решению этой проблемы является метод множественного восстановления, но он часто затруднен сложностью вычислений и неопределенностью в оценке потерянных значений. Поэтому, необходимо разработать более эффективный и универсальный метод, который бы способствовал восстановлению отсутствующих значений, оценивал их неопределенность и мог быть применен в различных областях. ## Метод метод kNNSampler предластовает способ восстановления отсутствующих значений с помощью стохастического имипутационного метода. Метод использует $k$-ближайших соседей (k-NN) для выбора единиц с наиболее похожими наблюдаемыми признаками. Затем, для каждого отсутствующего значения, он проводит стохастическую импутацию, отсылая к распределению значений того же признака у соседей. На основе этого, kNNSampler может оценивать не только отсутствующие значения, но и их неопределенность. Этот подход легко реализуется и может быть использован для множественного восстановления, что делает его эффективным и универсальным. ## Результаты Для исследования эффективности метода были проведены эксперименты на различных датасетах с разным процентом отсутствующих значений. Эксперименты показали, что kNNSampler демонстрирует высокую точность в восстановлении отсутствующих значений в сравнении с другими методами, такими как kNNImputer. Он также удачно оценивает неопределенность восстановленных значений, что делает его подход необходимым для множественного восстановления. Результаты этих экспериментов подтверждают, что kNNSampler может быть применен в различных ситуациях, где требуется восстановление отсутствующих значений. ## Значимость Качество восстановления отсутствующих значений является критическим для многих областей, включая машинное обучение, анализ данных, инженерию и даже медицину. Метод kNNSampler может быть использован в этих областях для улучшения точности моделей и анализа. Он также обладает преимуществами перед другими методами, такими как более точное оценивание неопределенности, что делает его более надежным. Это может привести к улучшению качества решений в различных приложениях. ## Выводы Метод kNNSampler предлагает эффективный и универсальный подход к восстановлению отсутствующих значений в данных. Он не только восстанавливает отсутствующие значения, но и оценивает их неопреде

Annotation:

We study a missing-value imputation method, termed kNNSampler, that imputes a given unit's missing response by randomly sampling from the observed responses of the $k$ most similar units to the given unit in terms of the observed covariates. This method can sample unknown missing values from their distributions, quantify the uncertainties of missing values, and be readily used for multiple imputation. Unlike popular kNNImputer, which estimates the conditional mean of a missing response given an ...

ID: 2509.08366v1 stat.ML, cs.LG, math.ST, stat.ME, stat.TH

arXiv PDF

📄 Gaussian Process Regression -- Neural Network Hybrid with Optimized Redundant Coordinates

2025-09-12

Авторы:

Sergei Manzhos, Manabu Ihara

## Контекст Гауссовский процесс (Gaussian Process, GP) является популярным методом для решения задач регрессии и классификации, основанного на теории вероятностей. Он представляет зависимость между переменными как гауссовское распределение, позволяя оценивать не только точные значения, но и их неопределенность. Однако, существуют проблемы, связанные с ограниченной способностью GP учитывать сложные нетривиальные зависимости, которые могут присутствовать в данных. Нейронные сети (Neural Networks, NN), наоборот, обладают высокой мощностью использования данных, но могут страдать от переобучения при недостаточном количестве обучающих примеров или избыточной моделирования. Мотивацией для разработки GPRNN-гибридного подхода служит необходимость объединить выразительную способность NN с гибкостью и надежностью GP, чтобы оптимизировать процесс обучения и получить более точные и устойчивые результаты. ## Метод GPRNN-гибрид основывается на использовании аддитивных ядер (additive kernels) GP в отношении реднидущих координат (redundant coordinates). Эти координаты, построенные по определенным правилам, позволяют представить высокомерные данные в низкомерные виды, упрощая работу модели. В этом исследовании предлагается оптимизировать эти координаты с помощью монте-карло-алгоритма (Monte Carlo algorithm). Архитектура системы включает нейросетевой слой, который обучается в сочетании с GP, чтобы улучшить точность и уменьшить вероятность переобучения. Эта архитектура рассматривается как улучшенная альтернатива глубоким нейронным сетям, когда многоуровневая модель может быть необязательной. ## Результаты Эксперименты проводились на различных задачах, таких как построение машинного обучения для интераторного потенциала и материаловедческие проблемы. Оценивались показатели качества, включая ошибку тестового набора (test set error) и степень переобучения. Результаты показали, что при использовании оптимизированных реднидущих координат (opt-GPRNN), модель достигла низкого уровня ошибок на тестовом наборе с значительно меньшим числом нейронов (или терминов) по сравнению с обычной GPRNN. Это позволило избежать переобучения при увеличении количества нейронов и улучшить производительность модели. Кроме того, оптимизация реднидущих координат позволила реализовать режим сжатия размерности данных, что делает модель еще более эффективной. ## Значимость Предлагаемый подход имеет широкие области применения, в том числе в машинном обучении, физике, химии и информатике. Наиболее выгодным является его применение там, где необходима высокая точность моделирования и низкая вероятность переобучения. Opt-GPRNN обладает потенциалом заменить глубокие нейронные с

Annotation:

Recently, a Gaussian Process Regression - neural network (GPRNN) hybrid machine learning method was proposed, which is based on additive-kernel GPR in redundant coordinates constructed by rules [J. Phys. Chem. A 127 (2023) 7823]. The method combined the expressive power of an NN with the robustness of linear regression, in particular, with respect to overfitting when the number of neurons is increased beyond optimal. We introduce opt-GPRNN, in which the redundant coordinates of GPRNN are optimiz...

ID: 2509.08457v1 stat.ML, cs.LG

arXiv PDF

📄 PEHRT: A Common Pipeline for Harmonizing Electronic Health Record data for Translational Research

2025-09-12

Авторы:

Jessica Gronsbell, Vidul Ayakulangara Panickan, Chris Lin, Thomas Charlon, Chuan Hong, Doudou Zhou, Linshanshan Wang, Jianhui Gao, Shirley Zhou, Yuan Tian, Yaqi Shi, Ziming Gan, Tianxi Cai

## Контекст Интегративный анализ многоинституциональных данных электронных медицинских карт (EHR) позволяет улучшить надежность и обобщаемость исследований в области трансляционной медицины. Это достигается благодаря работе с более крупными и разнообразными когортами пациентов, а также использованию различных семантических моделей. Однако, слияние EHR-данных подразумевает сложности, такие как разнообразие форматов, семантические различия и вопросы конфиденциальности. Для решения этих проблем предлагается $\textit{PEHRT}$ — стандартизированная пайплайн для гармонизации EHR-данных. Она распространяется на различные задачи, такие как обработка данных и создание моделей для исследований. ## Метод PEHRT состоит из двух основных модулей: (1) нормализации данных и (2) обучения моделей. Нормализация данных включает в себя маппинг EHR-данных на стандартные системы кодирования, что позволяет гармонизировать данные подходящим образом. Обучение моделей заключается в использовании машинного обучения для генерации информативных данных, готовых к использованию в исследованиях. Эта пайплайн является моделью-агностической и позволяет выполняться в разных учреждениях без необходимости передачи отдельных данных. Метод разработан на основе практических исследований и предоставляется как открытый исходный код со вспомогательными материалами. ## Результаты На основе PEHRT проводились различные эксперименты, включая гармонизацию данных из различных систем здравоохранения. Данные были маппяны на стандартные системы кодирования, а затем использованы для генерации моделей, готовых к использованию в исследованиях. Эксперименты показали, что PEHRT позволяет эффективно гармонизировать данные и создавать модели, которые могут быть использованы для распределенного интегративного анализа. ## Значимость PEHRT может быть применен в различных областях трансляционных исследований, включая улучшение надежности исследований, расширение крупных когорт, а также обработку различных моделей данных. Он предоставляет преимущества в виде унификации подходов и снижения затрат на создание исследовательских данных. PEHRT может способствовать развитию новых исследований в области медицины, позволяя использовать большое количество данных в различных задачах. ## Выводы PEHRT представляет собой эффективную пайплайн для гармонизации EHR-данных, которая может использоваться в различных областях медицины. В будущем будут проводиться дополнительные исследования для расширения функций и применения PEHRT в различных ситуациях.

Annotation:

Integrative analysis of multi-institutional Electronic Health Record (EHR) data enhances the reliability and generalizability of translational research by leveraging larger, more diverse patient cohorts and incorporating multiple data modalities. However, harmonizing EHR data across institutions poses major challenges due to data heterogeneity, semantic differences, and privacy concerns. To address these challenges, we introduce $\textit{PEHRT}$, a standardized pipeline for efficient EHR data ha...

ID: 2509.08553v1 stat.ML, cs.LG

arXiv PDF

📄 A hierarchical entropy method for the delocalization of bias in high-dimensional Langevin Monte Carlo

2025-09-12

Авторы:

Daniel Lacker, Fuzhong Zhou

## Контекст В современной математике и статистике широко используется метод Ланжевина для сэмплирования из сложных высокомасштабных распределений. Однако этот метод имеет значительную ошибку в сэмплировании, которая увеличивается пропорционально размерности пространства в квадрате, измеряемой по расстоянию в числе Вассерштейна. Несмотря на это, в последнее время выявлена интересная структурная особенность: если распределение имеет спарсенные взаимосвязи, то ошибка сэмплирования зависит только от размерности самой спарсенной части. В рамках этого исследования мы расширяем это понятие, показывая, что подобная структурная особенность присутствует даже в случае слабых взаимосвязей, а не только в случае спарсенности. Таким образом, мы монтируем новые горизонты в понимании и улучшении качества сэмплирования при помощи теории высокомасштабных распределений. ## Метод Мы применяем метод Ланжевина в высокоразмерных пространствах с целью оценивать распределение данных. Наша методология основывается на новом подходе к расчету энтропии в разные масштабы. Ранее известный метод деллокализации ошибки был ограничен определенным классом распределений с сильными взаимосвязями. Мы расширяем его доступность, доказывая, что данный эффект действует и для слабых взаимосвязей. Мы используем новый анализ, основанный на рекурсивной работе с маргинальными распределениями, что позволяет доказать новые теоретические свойства метода Ланжевина в задачах сэмплирования спарсенных пространств. ## Результаты Мы проводим эксперименты на основе синтетических данных, которые подтверждают полученные результаты. Наши результаты показывают, что для распределений с сильными и слабыми взаимосвязями распределение не только имеет меньшую ошибку, но и распределяется более равномерно по размерности. Мы тестируем нашу новую методологию на разных классах распределений и показываем, что наш подход дает значительное улучшение по сравнению с ранее известными методами в задачах сэмплирования спарсенных пространств. ## Значимость Наша работа имеет практическое значение в области сэмплирования сложных высокомасштабных распределений, которые часто встречаются в машинном обучении и финансовых моделях. Новый подход позволяет улучшить точность и эффективность сэмплирования в случаях спарсенных распределений. Это открывает новые возможности для применения метода Ланжевина в сложных задачах, где ранее он был неэффективен из-за высокой размерности. Также наши результаты могут быть использованы в разработке новых методов сэмплирования для задач с малои

Annotation:

The unadjusted Langevin algorithm is widely used for sampling from complex high-dimensional distributions. It is well known to be biased, with the bias typically scaling linearly with the dimension when measured in squared Wasserstein distance. However, the recent paper of Chen et al. (2024) identifies an intriguing new delocalization effect: For a class of distributions with sparse interactions, the bias between low-dimensional marginals scales only with the lower dimension, not the full dimens...

ID: 2509.08619v1 stat.ML, cs.LG, math.PR

arXiv PDF

📄 ADHAM: Additive Deep Hazard Analysis Mixtures for Interpretable Survival Regression

2025-09-11

Авторы:

Mert Ketenci, Vincent Jeanselme, Harry Reyes Nieva, Shalmali Joshi, Noémie Elhadad

## Контекст Сбои сердечно-сосудистой системы и другие тяжелые заболевания часто требуют моделирования временных интервалов до событий. Традиционные модели временных интервалов, такие как Cox proportional hazards и parametric models, не всегда предоставляют достаточную точность или интерпретируемость для клинических приложений. Нейронные сети, в свою очередь, предлагают высокую точность, но часто являются неинтерпретируемыми. Это недостаток значительно ограничивает их применение в клинической практике, где важно понимать, как отдельные факторы (например, родительские заболевания) влияют на временные интервалы до событий. Для решения этой проблемы мы предлагаем **ADHAM**, интерпретируемую нейронную сеть для моделирования временных интервалов до событий. ## Метод **ADHAM** — это нейронная сеть с аддитивным структурированием, которая моделирует временные интервалы до событий с помощью комбинации функций риска, которые зависят от признаков. Мы предлагаем метод, который позволяет определить группы подобных объектов с помощью нейронных сетей, а затем оценить их влияние на временные интервалы. Для того, чтобы сократить число групп до наиболее значимых, мы вводим пост-тренировочный процесс, который объединяет похожие группы на основе их характеристик. ## Результаты Мы провели эксперименты с **ADHAM** на нескольких реальных датасетах, включая данные о раке и заболеваниях сердца. Эти эксперименты показали, что наша модель предоставляет интерпретируемые результаты, позволяющие понять, какие факторы влияют на временные интервалы. Например, в моделировании временных интервалов до рака мы можем увидеть, что группы людей с определенными генетическими факторами имеют более высокий риск. Эти результаты показали, что **ADHAM** применима как для групповых, так и для индивидуальных прогнозов. ## Значимость Мы видим применение нашей модели в санитарной статистике, клинических решениях и предложении новых лекарств. ADHAM позволяет упростить понимание влияния разных факторов на временные интервалы, что может помочь врачам принимать более обоснованные решения. Модель характеризуется высокой точностью и интерпретируемостью, что делает ее уникальной в сравнении с другими моделями, которые могут предложить только точную, но неинтерпретируемую, оценку. ## Выводы **ADHAM** — это новая, интерпретируемая модель для моделирования временных интервалов до событий. Мы продемонстрировали ее высокую точность и интерпретируемость на реальных данных. У нас есть планы продолжать развивать **ADHAM**, сделав ее еще более точной и применимой к различным клиническим ситуациям. Мы также планируем провести дополнительные

Annotation:

Survival analysis is a fundamental tool for modeling time-to-event outcomes in healthcare. Recent advances have introduced flexible neural network approaches for improved predictive performance. However, most of these models do not provide interpretable insights into the association between exposures and the modeled outcomes, a critical requirement for decision-making in clinical practice. To address this limitation, we propose Additive Deep Hazard Analysis Mixtures (ADHAM), an interpretable add...

ID: 2509.07108v1 stat.ML, cs.LG

arXiv PDF

📄 NestGNN: A Graph Neural Network Framework Generalizing the Nested Logit Model for Travel Mode Choice

2025-09-11

Авторы:

Yuqi Zhou, Zhanhong Cheng, Lingqian Hu, Yuheng Bu, Shenhao Wang

## Контекст Одна из ключевых задач в анализе поведения людей в условиях выбора между альтернативами является моделирование дискретного выбора. Одним из наиболее популярных подходов является модель гнездового лога (Nested Logit, NL). Она используется для решения проблем в области транспортного пространства, включая выбор транспортного средства, решения по области жительства и автомобильного владения. Однако классическая модель NL имеет ограниченную способность представления и зачастую требует ручной спецификации ценностей. Для преодоления этих ограничений, недавно были введены нейросетевые модели, но они не могут прямо учитывать корреляции между альтернативами внутри выбора. Это создает необходимость в развитии моделей, которые могут эффективно учитывать такие корреляции. Наша работа направлена на развитие модели, которая бы обобщила классическую модель NL и улучшила ее мощь в решении транспортных задач. ## Метод Наша работа основывается на идее «альтернативного графа», который представляет собой структуру, описывающую взаимосвязи между альтернативами в выборе. Мы предлагаем Nested Alternative Graph (NAG), который расширяет классический NL подход, используя преимущества графовых нейросетей (Graph Neural Networks). Мы предлагаем NestGNN — новую архитектуру, которая генерализует классический NL-модель, добавляя гибкость и мощь графовых моделей. NestGNN представляет данные в виде сложной структуры, учитывающей взаимосвязи между альтернативами, что позволяет лучше предсказывать выбор и улучшать прозрачность модели. ## Результаты Мы проводили эксперименты на реальных данных, сравнив NestGNN с классическими NL-моделями и другими DNN-моделями. Наша модель показала существенное улучшение прогнозируемой точности, суперудаляя NL-модели на 9.2%. Кроме того, мы проанализировали вклад каждого компонента в предсказания и проаппроксимировали зависимости между альтернативами в выборе. Эти результаты показывают, что NestGNN сохраняет две основные характеристики классической NL-модели: пропорциональный выбор внутри группы (nest) и непропорциональный выбор между группами. Это делает NestGNN более гибкой и точной для моделирования транспортных выборов. ## Значимость Мы видим применение NestGNN в различных областях, включая транспортные системы, энергетику, и даже рынки потребления. Наш подход обладает важной преимуществом — он может учитывать взаимосвязи между альтернативами, что часто отсутствует в других моделях. Это дает ряд преимуществ: более точные прогнозы, более гибкая модель, которая может быть использована для разных задач. Мы считаем, что NestGNN может стать ново

Annotation:

Nested logit (NL) has been commonly used for discrete choice analysis, including a wide range of applications such as travel mode choice, automobile ownership, or location decisions. However, the classical NL models are restricted by their limited representation capability and handcrafted utility specification. While researchers introduced deep neural networks (DNNs) to tackle such challenges, the existing DNNs cannot explicitly capture inter-alternative correlations in the discrete choice conte...

ID: 2509.07123v1 stat.ML, cs.LG

arXiv PDF

📄 Identifying Neural Signatures from fMRI using Hybrid Principal Components Regression

2025-09-11

Авторы:

Jared Rieck, Julia Wrobel, Joshua L. Gowin, Yue Wang, Martin Paulus, Ryan Peterson

## Контекст Функциональная магнитная резонансная имажирования (fMRI) позволяет изучать динамику активности мозга во время выполнения различных задач, таких как управление риском, регуляция эмоций и мотивация. Однако анализ данных fMRI часто сталкивается с проблемами, такими как высокая размерность данных и неоднозначность наличия важной информации в отдельных викселях или перцептуальных компонентах. Одним из популярных подходов для решения этих задач является практика регуляризации многовиксельных паттернов (MVPA) с помощью LASSO Перцептрона (LASSO PCR). Однако этот подход предполагает, что все компоненты принципиальных составляющих (PC) равновероятно содержат важную информацию, что не всегда соответствует реальности. Наша мотивация заключается в разработке усовершенствованных методов для более точной идентификации нейрологических признаков, учитывающих специфичность распределения сигнала в PC. ## Метод Мы предлагаем две модификации LASSO PCR для улучшения выбора компонент принципиальных составляющих. В первой модели, названной **Sparsity-Ranked LASSO (SRL)**, вводится регуляризационный штраф, который зависит от индекса PC, отражающий предположение о том, что более важное сведение содержится в PC с большим вариационным вкладом. Во второй модели, **Joint Sparsity-Ranked LASSO (JSRL)**, мы объединяем компонентный и виксельный уровни активности в рамках идеи информационного паритета. JSRL вводит дополнительный штраф, стимулирующий выбор компонент с максимальной квантильной спарсиностью, чтобы обеспечить подбор наиболее актуальных компонент. Эти модели были протестированы на данных fMRI, собранных во время выполнения задач регуляции эмоций, управления риском и мотивации. ## Результаты Использовавшийся набор данных включал fMRI-сканы 50 участников, выполнявших различные тестовые задачи. Мы сравнивали SRL и JSRL с классическим LASSO PCR, измеряя кросс-валидационный $R^2$ и AUC. Результаты показали, что SRL улучшила кросс-валидационный $R^2$ на 24.7%, а AUC на 3.9% по сравнению с LASSO PCR. Более того, JSRL достигла наиболее заметных улучшений: $R^2$ увеличился на 51.7%, а AUC — на 7.3%. Более того, оба новых подхода демонстрировали более точное распределение признаков по регионам мозга, соответствующим их функциональным ролям, в сравнении с LASSO PCR. ## Значимость Предложенные модели могут быть применены во всех областях, где используются методы MVPA для анализа fMRI, включая психологию, нейрологию и психиатрию. Они предоставляют более точный механизм выделения важного сведения в данных fMRI, улучшая качество классификации и понимания того, какие мозго

Annotation:

Recent advances in neuroimaging analysis have enabled accurate decoding of mental state from brain activation patterns during functional magnetic resonance imaging scans. A commonly applied tool for this purpose is principal components regression regularized with the least absolute shrinkage and selection operator (LASSO PCR), a type of multi-voxel pattern analysis (MVPA). This model presumes that all components are equally likely to harbor relevant information, when in fact the task-related sig...

ID: 2509.07300v1 stat.ML, cs.LG

arXiv PDF

📄 Asynchronous Gossip Algorithms for Rank-Based Statistical Methods

2025-09-11

Авторы:

Anna Van Elst, Igor Colin, Stephan Clémençon

## Контекст В последние годы рост децентрализованных сетей и развитие ИИ на границах (edge intelligence) привело к возникновению критических проблем, связанных со стабильностью и доверительностью в распределенных системах. Использование простых статистических мер, таких как среднее или суммарное значение, делает такие системы уязвимыми к повреждению данных, в том числе злонамеренным воздействием. Необходимость развития более надежных методов вызвана ростом требований к защите от выбросов и атак. В результате, акцент сделан на развитии статистических методов, основанных на рангировании, таких как ранговые тестове и L-статистики, известные своей устойчивостью к выбросам. Однако, применение этих методов в распределенных сетях, где узлы обмениваются данными асинхронно, остается практически нераскрытым. Это мотивирует нашу работу над разработкой асинхронных голосований для вычисления ранговых статистик. ## Метод Мы разработали асинхронные голосования для вычисления ранговых статистик, включая L-статистики и ранговые тесты. Наша методика основана на методологии голосований, где узлы обмениваются своими ранговыми значениями, используя локальные вычисления. Для гарантии точности и сходимости, мы использовали технику регуляризации и адаптивного удаления выбросов. Главным инновационным элементом является наша реализация асинхронного протокола, который позволяет узлам обмениваться информацией независимо от синхронности в сети. Это значительно увеличивает устойчивость к дефекту в сети и делает алгоритмы более гибкими в различных условиях. ## Результаты Мы провели эксперименты на различных сетевых топологиях, включая звездообразную, цепочечную и случайную топологии. Наши результаты показали, что асинхронное голосование позволяет достичь точности, сопоставимой с синхронным подходом, при этом значительно сокращая время обмена данными. Мы также получили первые результаты по сходимости асинхронных голосований для вычисления ранговых статистик, в том числе для Wilcoxon rank-sum теста. ## Значимость Наша работа имеет значительное значение для развития децентрализованных систем AI и edge intelligence. Мы предлагаем методы, которые могут быть использованы в области статистики, тестирования гипотез, и робастной обработке данных. Наш подход широко применим в ситуациях, где необходима надежность в распределенных сетях, присутствие подрывных данных или атак. ## Выводы Мы разработали эффективный асинхронный подход для вычисления ранговых статистик, обеспечивающий высокую точность и устойчивость в распределенных сетях. Наши результаты открывают новые

Annotation:

ID: 2509.07543v1 stat.ML, cs.LG

arXiv PDF

Показано 441 - 450 из 564 записей