📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня
Авторы:

Ricardo Diaz-Rincon, Muxuan Liang, Adolfo Ramirez-Zamora, Benjamin Shickel

## Контекст Parkinson's Disease (PD) является хронической неврологической заболеванием, протекающим с выраженной индивидуальной течением. Одной из сложных задач в его лечении является корректное управление леводопиной дозировкой, которая требует учета индивидуального течения заболевания и ответа на лечение. Невралы должны сбалансировать контроль симптомов с оптимальной дозировкой дапаминергических препаратов, минимизируя стоимость побочных эффектов. Недостаточная или абрупная корректировка дозы может вызвать такие проблемы, как дискинезия, опоздание и невропсихические отклонения, существенно снижая качество жизни пациента. Текущие подходы к решению этой задачи основываются на творческом опыте и переживании, не имеют систематизированной методологии. Машинное обучение, несмотря на его прогресс, в свою очередь, сталкивается с проблемой недоверия клиников, так как показывает только точные предсказания без учета их неопределенности. Это ограничивает пользующиеся методом клинических решений. Необходимо разработать метод, который не только предскажет необходимую дозу, но и при этом даст статистически обоснованные интервалы доверия. ## Метод Мы разработали два-этапный подход, основанный на конformal prediction, для прогноза необходимости леводопины до 2 лет вперёд. Этап первый выявляет пациентов, которым может понадобиться корректировка лечения, а второй этап прогнозирует значение леводопинынго эквивалентного ежедневного дозировки (LEVD). Мы использовали данные электронных медицинских рекордов 631 пациентов с PD, наблюдавшихся в University of Florida Health в период 2011–2021 годов. Необходимость учитывать несимметричный распределение данных (zero-inflation) привела к разработке специальных мер, чтобы гарантировать качество прогнозов при таких условиях. Особенностью нашего подхода является учет неопределенности, что позволяет клиникам принимать более обоснованные решения о корректировке лечения. ## Результаты Мы получили значительные результаты в области прогнозирования необходимости корректировки леводопины дозы. Наша модель демонстрирует высокую точность при сохранении доверительных интервалов, которые значительно короче, чем в традиционных подходах. Это позволяет предсказывать необходимые корректировки на короткие сроки с высокой точностью и для долгосрочных прогнозов — более широкие интервалы. Экспериментальные результаты показали, что наш алгоритм сохраняет статистически значимый уровень доверия к прогнозам, что значительно улучшает надежность решений клиников. ## Значимость Предлагаемый подход может быть применён в клинической практике для оптимизации лечения
Annotation:
Parkinson's Disease (PD) medication management presents unique challenges due to heterogeneous disease progression and treatment response. Neurologists must balance symptom control with optimal dopaminergic dosing based on functional disability while minimizing side effects. This balance is crucial as inadequate or abrupt changes can cause levodopa-induced dyskinesia, wearing off, and neuropsychiatric effects, significantly reducing quality of life. Current approaches rely on trial-and-error dec...
ID: 2508.10284v1 cs.LG, stat.ME, stat.ML
Авторы:

Danial Saber, Amirali Salehi-Abari

## Контекст Graph neural networks (GNNs) широко применяются в таких областях, как рекомендательные системы, проектирование материалов и репозиция лекарств. Однако message-passing GNNs сталкиваются с проблемой over-squashing — экспоненциального сжатия длинного-дистанционного информации между узлами. Эта проблема ограничивает их выразительность и эффективность. Несмотря на то, что ревьюинг (ревьютинг) техник могут уменьшить эту проблему, их эффективность и практическое влияние недостаточно изучены, в частности, из-за отсутствия точной метрики для измерения over-squashing. Мы предлагаем метод оценки over-squashing на основе декремента чувствительности между узлами, который может быть расширен на граф-уровневые статистики: распространенность, интенсивность, вариабельность и экстремальность. Целью нашей работы является оценка того, как различные методы ревьюинга влияют на over-squashing и как эти изменения отражаются на результатах классификации. ## Метод Мы предлагаем метрику, основанную на мультипликативном снижении чувствительности (Mutual Sensitivity Decay, MSI), чтобы измерить over-squashing между узлами. Эта метрика позволяет проанализировать как индивидуальные пары узлов, так и графы в целом. Для оценки over-squashing на уровне графа, мы разработали граф-уровневые метрики: prevalence, intensity, variability и extremity. Для изучения эффекта ревьюинга, мы применяем между-графовую проекцию (within-graph causal design) для измерения потенциального влияния ревьюинг-методов на классификационные данные. Мы проводим эксперименты на нескольких бенчмарках классификации графа и нод, чтобы оценить то, как различные методы ревьюинга влияют на over-squashing и на предсказательную эффективность моделей. ## Результаты Наши эксперименты показали, что большинство датасетов классификации графа страдают от over-squashing, но в разных масштабах. Мы обнаружили, что ревьюинг может существенно уменьшить over-squashing, особенно когда данные сильно страдают от этой проблемы. Однако, на node classification datasets, ревьюинг часто усиливает over-squashing, и преобразования в over-squashing не коррелируют с изменениями в производительности. Мы также обнаружили, что только тщательно примененная ревьюинг может улучшить результаты, тогда как неограниченный или чрезмерно агрессивный ревьюинг может привести к негативным результатам. Наши метрики позволяют практикам установить, плановая ли ревьюинга, и будет ли она эффективна на определенном датасете. ## Значимость Наши результаты имеют большое значение для области GNNs, поскольку они демонстрируют, что over-squashing является важной проблемой для классификации графа, но её значимость и оптимальный подход к решению зависят от конкретных датасетов и за
Annotation:
Graph neural networks (GNNs) have exhibited state-of-the-art performance across wide-range of domains such as recommender systems, material design, and drug repurposing. Yet message-passing GNNs suffer from over-squashing -- exponential compression of long-range information from distant nodes -- which limits expressivity. Rewiring techniques can ease this bottleneck; but their practical impacts are unclear due to the lack of a direct empirical over-squashing metric. We propose a rigorous, topolo...
ID: 2508.09265v1 cs.LG, stat.ME
Авторы:

Muralikrishnna G. Sethuraman, Faramarz Fekri

## Контекст Вопрос изучения закономерностей, взаимосвязей и причинных связей между переменными широко распространен в науке и применяется в различных областях, таких как биология, экономика и информатика. Однако, многие методы, используемые в качестве средств для выявления таких связей, приходят к некоторым ограничениям. Они часто работают с предположениями об отсутствии неизмеренных конфундеров (неизмеренных переменных, влияющих на основные переменные) или с предположением того, что граф причинных связей является ациклическим. Недостатком таких подходов является то, что в реальных системах, таких как биологические сети, эти предположения часто не выполняются. Изложенная проблема поощряет развитие методов, которые могут обнаруживать системные связи в нерегулярных условиях, в том числе при неизмеренных конфундерах. ## Метод Мы предлагаем DCCD-CONF, новую разностительную рамку для выявления циклических причинных связей в системах с неизмеренными конфундерами с использованием вмешательствных данных. Рамка основывается на дифференцируемой оптимизации, которая позволяет изменять структуру графа и оценивать распределение конфундеров. Мы используем лог-ликейл-функцию для максимизации вероятности данных и альтернативные шаги для оптимизации структуры графа и оценки конфундеров. Это позволяет нашему подходу гибко работать с нелинейными связями и сложным данным. ## Результаты Мы проверили DCCD-CONF на синтетических данных и на реальных данных по изменению генов. Наши эксперименты показали, что DCCD-CONF превосходит существующие методы как в восстановлении структуры графа, так и в выявлении конфундеров. Эта система показала высокую точность в обнаружении циклических связей и позволяет выделять значимые связи даже в системах с неизмеренными конфундерами. ## Значимость Наш подход может применяться в различных научных областях, включая биологию сетей, экономические модели и машинное обучение. Он предоставляет более точные средства для визуализации причинных связей и выявления взаимосвязей, даже в сложных системах. Благодаря его гибкости и соответствию теоретическим гарантиям, DCCD-CONF может стать ключевым инструментом для развития теории и практики выявления причинных связей. ## Выводы Мы предлагаем DCCD-CONF как мощный подход к выявлению циклических причинных связей в сложных системах, в том числе при наличии неизмеренных конфундеров. Наши результаты показали, что этот метод превосходит существующие подходы в точности и гибкости. Мы также подтвердили теоретическое свойство нашего подхо
Annotation:
Understanding causal relationships between variables is fundamental across scientific disciplines. Most causal discovery algorithms rely on two key assumptions: (i) all variables are observed, and (ii) the underlying causal graph is acyclic. While these assumptions simplify theoretical analysis, they are often violated in real-world systems, such as biological networks. Existing methods that account for confounders either assume linearity or struggle with scalability. To address these limitation...
ID: 2508.08450v1 cs.LG, stat.ME, stat.ML
Авторы:

Olivier Jeunen

## Контекст Meta-analysis является важной методологией в статистике, которая используется для объединения результатов независимых исследований для получения более точного и надежного оценки. Она применяется в различных областях, включая здравоохранение, образование и научные исследования. Однако, применение мета-анализа в области Off-Policy Estimation (OPE), которая используется для оценки политик в рекомендательных системах, еще является плодотворным, но недостаточно изученным направлением. Оценка политик в OPE является ключевым заданием, позволяющим производить безотклонную оценку онлайн-результатов, используя только offline-данные. Существуют многочисленные OPE-методы, включая Doubly Robust (DR), все они предлагают различные стратегии комбинирования данных значения (value-based) и политики (policy-based). Наша работа привносит новую точку зрения в комбинирование этих методов, с использованием модели meta-analysis, чтобы повысить точность и уменьшить неопределенность в оценке политик. ## Метод Мы предлагаем мета-аналитическую модель для комбинирования OPE-методов. Модель основывается на коррелированном фиксированных эффектов подходе, который учитывает зависимости между OPE-методами, вызванные общими данными. Мы применяем теорию оптимального взвешивания, чтобы вычислить лучшую линейную независимую оценку (BLUE) для оценки политики, а также построить соответствующую более точную и консервативную доверительную интервал. Модель формализует зависимости между OPE-методами и использует их для повышения точности оценки. Мы используем обобщенную квадратичную форму для моделирования этих зависимостей и применяем корреляционную модель для вычисления весов каждого метода. ## Результаты Мы проверили нашу модель на обоих симулированных и реальных данных. Для симулированных данных, мы синтезировали данные, которые подразумевают различные условия, в том числе различное количество данных, различные статистические модели и различные методы OPE. На реальных данных, мы использовали данные из рекомендательных систем, оценивая различные политики. Наши результаты показали, что мета-аналитическая модель позволяет повысить точность оценки политик в сравнении с использованием отдельных OPE-методов. Мы также показали, что доверительные интервалы, полученные с помощью нашей модели, являются более консервативными, что соответствует реальному распределению ошибок в OPE. ## Значимость Мета-аналитический подход может быть применен в различных областях, где требуется комбинирование независимых оценок, таких как здравоохранение, моделирование климата и рекомендательные системы. Мы показали, что наш подход может существенно повысить точность и уменьшить неопределен
Annotation:
Off-policy estimation (OPE) methods enable unbiased offline evaluation of recommender systems, directly estimating the online reward some target policy would have obtained, from offline data and with statistical guarantees. The theoretical elegance of the framework combined with practical successes have led to a surge of interest, with many competing estimators now available to practitioners and researchers. Among these, Doubly Robust methods provide a prominent strategy to combine value- and po...
ID: 2508.07914v1 stat.ML, cs.IR, cs.LG, stat.ME
Авторы:

Leonardo V. Santoro, Victor M. Panaretos

## Контекст Исследование альтернативных методов тестирования двух выборок является ключевым вопросом в теории вероятности и статистике. Существующие подходы часто ограничиваются гипотезами о распределении или требуют выбора априорных параметров. Это приводит к ограниченной общности и способности распознавать сильно различающиеся выборки. Необходимость развития более гибких и непараметрических подходов возникает в статистических приложениях, где присутствуют слабые сигналы и высокие размерности. Наша мотивация заключается в развитии метода, который объединяет классические подходы с новыми идеями о классификации гипотез при помощи ядерных техник. ## Метод Мы предлагаем новый ядерный подход к двухвыборочному тестированию, основанный на подходе, использующем обобщенные ядерные приближения для вероятностных мер. Ключевой идеей является использование связи между ядерными обобщениями матриц ковариаций и двумерных гауссовых пространств. На основе этой связи мы формулируем тестирующую статистику, основанную на относительном энтропии между гауссовыми приближениями. Это позволяет тестировать не только равенство распределений, но и их неравенство. Чтобы сделать метод применимым в практических ситуациях, мы предлагаем регуляризованную версию, которая балансируется с помощью пермутаций. Это обеспечивает корректную оценку в условиях ограниченных данных. ## Результаты Мы проверили наш подход на синтетических и реальных данных. Наблюдается значительное улучшение в сравнении с текущими стандартными методами, особенно в ситуациях, когда данные имеют высокую размерность и слабые сигналы. Эксперименты показали, что наш подход обнаруживает различия выборок эффективнее большинства современных алгоритмов. Наши результаты показывают, что ядерная техника дает более точное определение различий между выборками и может эффективно применяться в сложных статистических задачах. ## Значимость Предлагаемый подход может быть применен в различных областях, включая генетическое исследование, искусственный интеллект и моделирование финансовых процессов. Он объединяет многие преимущества ранее разработанных методов, в то же время усиливает свою силу в обнаружении неравенств между распределениями выборок. Наш подход имеет потенциал для улучшения точности и доступности методов в поиске различий в выборках, что может существенно повлиять на развитие статистических приложений в науке и технологиях. ## Выводы Мы сформулировали новый тест для двух выборок на основе ядерных приближений. Наш под
Annotation:
We propose a novel kernel-based nonparametric two-sample test, employing the combined use of kernel mean and kernel covariance embedding. Our test builds on recent results showing how such combined embeddings map distinct probability measures to mutually singular Gaussian measures on the kernel's RKHS. Leveraging this result, we construct a test statistic based on the relative entropy between the Gaussian embeddings, i.e.\ the likelihood ratio. The likelihood ratio is specifically tailored to de...
ID: 2508.07982v1 stat.ML, cs.LG, stat.ME, 62G10, 62G20, 62H15, 62H20, 60G15, 46E22
Авторы:

Benedikt Fröhlich, Alison Durst, Merle Behr

#### Контекст В настоящее время обширно применяются машинные обучения (ML) для решения различных задач, и интерпретация моделей ML становится все более важной. Одним из популярных способов получения понимания модели является анализ вклада признаков (Feature Importance, FI). Распространенной проблемой является то, что FI может оказаться сильно зависим от корреляции между признаками в обучающих данных, что приводит к неточным оценкам. Например, если несколько признаков сильно коррелированы с целевым сигналом, а также со взятой из шума, то шумный признак может получить более высокий вклад в FI, чем любой другой признак. Такая ситуация требует разработки методов, которые позволят улучшить FI, даже в случае высокой корреляции признаков. #### Метод Метод, предложенный в статье, называется Local Sample Weighting (LOSAW). Он локально применяется в машинном обучении для уменьшения корреляции между признаками, когда FI оценивается. LOSAW вдохновлен техникой "inverser Wahrscheinlichkeitsgewichtung" из рамков причинного анализа. Основная идея состоит в том, что в каждой точке обучения модели веса выборок пересчитываются так, чтобы признак, который исследуется, был декоррелирован от остальных признаков. Это улучшает точность оценки FI. Для регулирования количества декорреляции вводится минимальный эффективный размер выборки (Minimum Effective Sample Size, MESS), который позволяет сбалансировать точность и биаз модели. LOSAW может быть интегрирован в различные ML-алгоритмы, включая случайные лесы и сверточные нейронные сети. #### Результаты Авторы провели эксперименты на различных симуляционных данных, показав разные зависимости между признаками. Эксперименты показали, что LOSAW улучшает FI в плохо декоррелированных случаях без существенного ухудшения FI в случаях более декоррелированных данных. Также была проверена эффективность LOSAW в контексте случайных лесов и нейронных сетей, где он повысил качество FI. Было также выявлено, что LOSAW может улучшить точность предсказаний, особенно при работе с данными, не входящими в обучающую выборку (out-of-distribution). #### Значимость Важность LOSAW заключается в том, что он значительно улучшает точность FI в случаях, когда признаки сильно коррелированы. Это полезно для понимания работы многих ML-моделей, в том числе случайных лесов и нейронных сетей. Значительное преимущество LOSAW заключается в том, что он может быть интегрирован в различные ML-алгоритмы без существенных изменений архитектуры. Более того, LOSAW позволяет регулировать точность и биаз модели, используя минимальный эффективный размер выборки, что дает преимущество в управлении торговлей между точностью и простотой. #### Выводы В результате, LOSAW демонстрирует способность улучшать FI в за
Annotation:
Feature importance (FI) statistics provide a prominent and valuable method of insight into the decision process of machine learning (ML) models, but their effectiveness has well-known limitations when correlation is present among the features in the training data. In this case, the FI often tends to be distributed among all features which are in correlation with the response-generating signal features. Even worse, if multiple signal features are in strong correlation with a noise feature, while ...
ID: 2508.06337v1 stat.ML, cs.LG, stat.ME
Авторы:

Ahmad Saeed Khan, Erik Schaffernicht, Johannes Andreas Stork

**Резюме** Оценка каузальных эффектов из необъективных данных стала вызовом из-за селекционной биаса, вызывающего неоднородность распределений признаков между группами лечения. Методы взвешивания на основе оценки вероятности включения (propensity score weighting) широко используются для устранения этой проблемы, но их эффективность сильно зависит от качества оценки вероятности и данных. Например, обратное взвешивание вероятности (IPW) может привести к нестабильным весам при высокой дисперсии вероятности, что портит баланс признаков и точность оценки эффекта лечения. В статье предложен метод **Deconfounding Factor Weighting (DFW)**, который использует деконфундинг-фактор для построения более стабильных весов. DFW ориентируется на менее зависимые от селекционной биаса объекты, уменьшая влияние высоко-зависимых, и формирует подпублика, более приближенную к выборке случайного контролируемого испытания (RCT). Метод гарантирует ограниченные веса, низкую дисперсию и лучший баланс признаков. Хотя DFW разработан для двойных лечений, он легко расширяется на множественные лечения, основываясь на оценке вероятности полученного лечения. Исследования на реальных и синтетических данных показали, что DFW примечательно превосходит существующие методы, такие как IPW и CBPS, в балансе признаков и оценке эффекта лечения.
Annotation:
Estimating causal effects from observational data is challenging due to selection bias, which leads to imbalanced covariate distributions across treatment groups. Propensity score-based weighting methods are widely used to address this issue by reweighting samples to simulate a randomized controlled trial (RCT). However, the effectiveness of these methods heavily depends on the observed data and the accuracy of the propensity score estimator. For example, inverse propensity weighting (IPW) assig...
ID: 2508.05215v1 cs.LG, stat.ME
Показано 81 - 87 из 87 записей