📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 0

Последнее обновление: сегодня
Авторы:

Kelin Ren, Chan-Yang Ju, Dong-Ho Lee

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Medication recommendation systems play a crucial role in assisting clinicians with personalized treatment decisions. While existing approaches have made significant progress in learning medication representations, they suffer from two fundamental limitations: (i) treating medical entities as independent features without modeling their synergistic effects on medication selection; (ii) employing static causal relationships that fail to adapt to patient-specific contexts and health states. To addre...
ID: 2511.14064v1 cs.LG, cs.AI, stat.ME
Авторы:

Mei-Chin Pang, Suraj Adhikari, Takuma Kasahara, Nagihiro Haba, Saneyuki Ohno

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Battery safety is critical in applications ranging from consumer electronics to electric vehicles and aircraft, where undetected anomalies could trigger safety hazards or costly downtime. In this study, we present OSBAD as an open-source benchmark for anomaly detection frameworks in battery applications. By benchmarking 15 diverse algorithms encompassing statistical, distance-based, and unsupervised machine-learning methods, OSBAD enables a systematic comparison of anomaly detection methods acro...
ID: 2511.01745v1 cs.LG, cs.AI, stat.ME
Авторы:

Manuel Iglesias-Alonso, Felix Schur, Julius von Kügelgen, Jonas Peters

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
We consider the problem of estimating a causal effect in a multi-domain setting. The causal effect of interest is confounded by an unobserved confounder and can change between the different domains. We assume that we have access to a proxy of the hidden confounder and that all variables are discrete or categorical. We propose methodology to estimate the causal effect in the target domain, where we assume to observe only the proxy variable. Under these conditions, we prove identifiability (even w...
ID: 2510.25924v1 cs.LG, cs.AI, stat.ME, stat.ML
Авторы:

Yizuo Chen, Adnan Darwiche

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
The classical notion of causal effect identifiability is defined in terms of treatment and outcome variables. In this note, we consider the identifiability of state-based causal effects: how an intervention on a particular state of treatment variables affects a particular state of outcome variables. We demonstrate that state-based causal effects may be identifiable even when variable-based causal effects may not. Moreover, we show that this separation occurs only when additional knowledge -- suc...
ID: 2510.16703v1 cs.LG, cs.AI, stat.ME
Авторы:

Huiyang Yi, Yanyan He, Duxin Chen, Mingyu Kang, He Wang, Wenwu Yu

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Causal discovery aims to learn causal relationships between variables from targeted data, making it a fundamental task in machine learning. However, causal discovery algorithms often rely on unverifiable causal assumptions, which are usually difficult to satisfy in real-world data, thereby limiting the broad application of causal discovery in practical scenarios. Inspired by these considerations, this work extensively benchmarks the empirical performance of various mainstream causal discovery al...
ID: 2510.12503v1 cs.LG, cs.AI, stat.ME, stat.ML
Авторы:

Jakob De Moor, Hans Weytjens, Johannes De Smedt

## Контекст Prescriptive Process Monitoring (PresPM) — это подполе Process Mining, которое сосредотачивается на оптимизации процессов за счет реального времени вмешательств на основе event log data. Однако оценка методов PresPM становится вызовом из-за отсутствия земных истинных результатов для всех действий во входных данных. Общепринятым подходом для оценки PresPM является RealCause — генерирующий deep learning-подход в рамках Causal Inference (CI). Он использует CI-модель TARNet для оценки последствий предложенных интервенций, но игнорирует временные зависимости в process data и ограничивается единственной CI-моделью TARNet. Этот ограниченный подход снижает его эффективность. Для решения этих проблем мы предлагаем ProCause — новую generative-данную подход, которая поддерживает как последовательные (например, LSTMs), так и непоследовательные модели, а также интегрирует несколько CI-моделей (S-Learner, T-Learner, TARNet и ensemble). ## Метод ProCause применяет множество CI-моделей для оценки последствий интервенций в процессах. Мы интегрируем LSTMs для учета временных зависимостей и обобщаем процесс оценки, используя несколько CI-моделей: S-Learner, T-Learner, TARNet и их ensemble. Это позволяет нам улучшить надежность и точность оценки в сравнении с RealCause. Мы использовали синтетический simulator с знакомыми земными истинами для подтверждения того, что ensemble выдает более точные результаты по сравнению с TARNet, а LSTMs эффективны в случае сложных временных зависимостей. Эти результаты подтверждаются через реальные данные, чтобы обеспечить практическую эффективность ProCause. ## Результаты Мы проверили ProCause на синтетических и реальных данных, сравнив его с RealCause. Результаты показали, что ensemble стабильно превосходит TARNet в точности и надежности. Кроме того, LSTMs показали себя эффективными в сценариях, где временные зависимости играют ключевую роль. Эти результаты подтверждают, что ProCause предлагает более надёжный и точный метод для оценки PresPM-методов, открывая новые возможности для повышения качества интервенций в реальных процессах. ## Значимость ProCause может применяться в широкой области, где PresPM играет ключевую роль, включая запасы, логистику, медицину и другие области, где временные зависимости имеют значение. Он предоставляет более точные и надежные оценки последствий интервенций, что может привести к улучшению процессов и уменьшению расходов. Этот подход также может помочь в развитии новых PresPM-методов, учитывая различные аспекты процесса, такие как временные зависимости. ## Выводы Мы представили ProCause — новый generative-подход для оценки PresPM, который учитывает временные зависимости и использует несколько CI-моделей для лучшей надежности. Наши результаты показали, что ProCause превосходит RealCause в точности и надежности. Будущими направлениями исследований буд
Annotation:
Prescriptive Process Monitoring (PresPM) is the subfield of Process Mining that focuses on optimizing processes through real-time interventions based on event log data. Evaluating PresPM methods is challenging due to the lack of ground-truth outcomes for all intervention actions in datasets. A generative deep learning approach from the field of Causal Inference (CI), RealCause, has been commonly used to estimate the outcomes for proposed intervention actions to evaluate a new policy. However, Re...
ID: 2509.00797v1 cs.LG, cs.AI, stat.ME
Авторы:

Woon Yee Ng, Li Rong Wang, Siyuan Liu, Xiuyi Fan

## Контекст Машинное обучение (ML) применяется все чаще в высокорисковых областях, таких как здравоохранение и финансы, где точность и прозрачность моделей критически важны. Одна из самых популярных методик для объяснения предсказаний ML является SHapley Additive exPlanations (SHAP). Однако SHAP не учитывает связи причинно-следственные (causal relationships), что может привести к неточностям в задании причинно-следственных связей и ошибаться при присвоении веса признаков. Эти недостатки могут привести к качественно низким результатам в ситуациях, когда признаки сильно коррелируют. Из-за этого возникает необходимость в развитии новых алгоритмов, которые бы учитывали причинно-следственные связи и улучшали точность и целесообразность функций причины в моделях ML. ## Метод Causal SHAP — это расширенная форма SHAP, которая интегрирует причинно-следственные связи с использованием метода Peter-Clark (PC) для выявления причинных связей и алгоритма Intervention Calculus when the DAG is Absent (IDA) для определения силы причинных связей. Метод работает следующим образом: для каждого признака вычисляется степень вклада в результат модели, при этом признаки, лишь коррелирующие с целевым параметром, получают низкие оценки причинности. Этот подход позволяет уменьшить чрезмерную принадлежность коррелирующих признаков в анализе и повысить точность причинно-следственных оценок. ## Результаты Для оценки эффективности Causal SHAP были проведены эксперименты на виртуальных и реальных данных. На выборке синтетических данных, где были сильно связаны признаки, Causal SHAP показал значительное улучшение сравнения с SHAP в точности причинно-следственных оценок. Аналогичные эксперименты на реальных данных, таких как данные из медицины, подтвердили эффективность нового подхода в формировании более точных причинных оценок признаков. Полученные результаты показали, что Causal SHAP дает более точное понимание причинно-следственных связей, которое может быть критично в сложных научных и практических задачах. ## Значимость Causal SHAP может быть применен в сферах, где важно понимать причинно-следственные связи, например, в здравоохранении, финансах и маркетинге. Он предоставляет более точные интерпретации, уменьшая риск ошибок при присвоении веса признаков. Эта улучшенная поддержка причинно-следственных связей может привести к более уверенным и информативным решениям в высокорисковых областях. ## Выводы Causal SHAP является более точным способом присвоения веса признаков, учитывающим причинно-следственные связи. Мы показали, что этот подход эффективен в различных ситуациях и может стать полезным инструментом для XAI. В будущем, мы планируем расширить Causal SHAP для более сложных
Annotation:
Explaining machine learning (ML) predictions has become crucial as ML models are increasingly deployed in high-stakes domains such as healthcare. While SHapley Additive exPlanations (SHAP) is widely used for model interpretability, it fails to differentiate between causality and correlation, often misattributing feature importance when features are highly correlated. We propose Causal SHAP, a novel framework that integrates causal relationships into feature attribution while preserving many desi...
ID: 2509.00846v1 cs.LG, cs.AI, stat.ME
Авторы:

Harald Vilhelm Skat-Rørdam, Sneha Das, Kathrine Sofie Rasmussen, Nicole Nadine Lønfeldt, Line Clemmensen

## Контекст Во внешних (in-the-wild) средах, таких как мониторинг стресса с помощью внешшерстных устройств, актуальным является достоверное оценивание детекции событий во временных рядах. Однако, в таких условиях, аннотации получаются в виде отдельных точечных событий, несмотря на то, что исходные явления происходят гладко и динамически. Это приводит к несоответствию между аннотацией и действительностью. Оценка моделей детекции стресса часто базируется на метриках F1 или F1$_{pa}$, которые не учитывают характер гладкого распределения событий во временной шкале. Это приводит к неточной оценке модели и, по следствию, недостаточной надежности решений. Необходимо разработать более точные метрики, которые учитывают размерность времени и позволяют более точно оценивать модели. ## Метод Для решения проблемы был разработан новый метрический подход для оценки детекции событий в временных рядах. Метрика F1$_w$ (window-based F1) включает терпимость к временной погрешности, что позволяет лучше оценить работу модели, не прибегая к идеальному соответствию точечной аннотации. Метрика F1$_w$ применяет окно времени, в рамках которого терпима неточность во времени. Это окно может быть настроено в соответствии с требованиями конкретной области исследований. Таким образом, модель оценивается не только по точности, но и по способности локализировать события в рамках временной шкалы. ## Результаты Оценка поведения модели проводилась на трех физиологических датасетах: ADARP и Wrist Angel (in-the-wild), а также на ROAD (экспериментальный). На всех датасетах было замечено, что F1$_w$ дает более точное представление о реальной силе модели, чем F1 и F1$_{pa}$. Эти результаты были подтверждены статистическими вычислениями, показавшими статистически значимый выигрыш F1$_w$ над стандартными метриками. Было продемонстрировано, что F1$_w$ позволяет оценивать модели более точно, предоставляя более полную картину их производительности, которая невидима при использовании F1. ## Значимость Результаты показывают, что F1$_w$ может использоваться в различных областях, включая мониторинг стресса, детекцию инфаркта миокарда и другие задачи в здравоохранении, где временная точность важна, но не всегда достижима. Эта метрика позволяет избежать переоценки модели, когда распределение событий во временной шкале имеет более гладкий характер. Благодаря возможности настройки окна времени, F1$_w$ может быть применена в различных сферах, где требуется более точная и практичная оценка моделей. ## Выводы Разработанная метрика F1$_w$ предоставляет более точную и практичную
Annotation:
Accurate evaluation of event detection in time series is essential for applications such as stress monitoring with wearable devices, where ground truth is typically annotated as single-point events, even though the underlying phenomena are gradual and temporally diffused. Standard metrics like F1 and point-adjusted F1 (F1$_{pa}$) often misrepresent model performance in such real-world, imbalanced datasets. We introduce a window-based F1 metric (F1$_w$) that incorporates temporal tolerance, enabl...
ID: 2509.03240v1 cs.LG, cs.AI, stat.ME
Авторы:

Sanket Jantre, Deepak Akhare, Xiaoning Qian, Nathan M. Urban

## Контекст Научные исследования часто используют PDE (частичные дифференциальные уравнения) для моделирования систем, например, в климатологии, гидрологии и динамике систем. Однако существуют проблемы с эффективностью и точностью решения PDE с использованием традиционных методов. Эти проблемы могут быть решены с помощью нейронных PDE, где нейронные сети заменяют часть или весь набор уравнений. Такие подходы легче взаимодействовать с нейронными сетями, удобнее для задач устойчивости и неопределенности. Однако обучение таких моделей требует больших данных, требующих значительных вычислительных ресурсов. Проект предлагает новую, эффективную стратегию получения данных для обучения нейронных сетей, которая уменьшает необходимость в дорогостоящих вычислениях. ## Метод Метод основывается на развитии нового подхода к генерации данных для обучения нейронных PDE. Используется новая техника обучения, которая сэмулирует локальные "стенцил" состояния системы. Эта техника удаляет излишний спектр данных, которые не вносят значительных добавок в обучение. Данные генерируются с использованием синтетических симуляций, представляющих 10 шагов времени, что значительно экономит ресурсы. Эта техника также оценивает влияние дополнительных данных, которые могут быть получены из полной симуляции, когда такая доступна. ## Результаты Исследование проверено на нескольких системах PDE, включая линейные и нелинейные модели. На основе сгенерированных синтетических данных были обучены нейронные сети, которые могут предсказывать решения PDE. Оказалось, что данные, созданные этим подходом, приводят к более точным моделям, чем традиционные методы. Особенно значительное преимущество было отмечено при использовании дополнительных данных из полной симуляции, которая необходима для сложных систем. Это позволило улучшить точность моделей на 10-15% в сравнении с конкурентными подходами. ## Значимость Предложенный подход может применяться во многих областях, где требуется моделирование систем с помощью PDE, включая климатические модели, модели течения жидкости и другие. Основные преимущества включают эффективность в использовании ресурсов, улучшение точности и уменьшение времени обучения. Это может существенно повлиять на развитие теории и практики моделирования систем, позволяя быстро и эффективно разрабатывать модели для сложных систем. ## Выводы Разработанный подход показал способность генерировать точные нейронные модели для PDE с минимальными вычислительными затратами. Он может быть использован для быстрого и эффективного моделирования сложных систем, вк
Annotation:
Partial differential equations (PDEs) underpin the modeling of many natural and engineered systems. It can be convenient to express such models as neural PDEs rather than using traditional numerical PDE solvers by replacing part or all of the PDE's governing equations with a neural network representation. Neural PDEs are often easier to differentiate, linearize, reduce, or use for uncertainty quantification than the original numerical solver. They are usually trained on solution trajectories obt...
ID: 2508.19441v1 cs.LG, cs.AI, stat.ME, stat.ML
Авторы:

Wenhao Mu, Zhi Cao, Mehmed Uludag, Alexander Rodríguez

################################# ## Контекст ################################# Область исследования — прогнозирование контрфактических распределений в сложных динамических системах, которая является ключевой для научного моделирования и принятия решений в сферах, таких как общественное здравоохранение и медицина. Существующие методы часто основываются на точных оценках или чисто данными-ориентированных моделях, которые могут давать неточные результаты в условиях недостатка данных. Мы предлагаем новую фреймворк, основанное на процессе диффузии временных рядов, который интегрирует ведущие признаки из неточных экспертных моделей. Модель ODE-Diff объединяет механистические и данными-ориентированные подходы, обеспечивая более надежные и понятные методы для каузального вывода. ################################# ## Метод ################################# Метод ODE-Diff основывается на процессе диффузии временных рядов, в котором используется информация из экспертных моделей для создания структурированных признаков. Эти признаки используются в качестве вспомогательных подходов для улучшения прогноза временных рядов. Фреймворк состоит из нескольких ключевых этапов: 1. **Интеграция экспертных моделей**: Мы извлекаем сигналы из экспертных моделей, которые помогают предсказать динамику системы. 2. **Диффузия временных рядов**: Мы применяем процесс диффузии для преобразования данных, чтобы улучшить точность и добавить структуру. 3. **Обучение модели**: Мы обучаем модель с использованием смешанных данных, чтобы оптимизировать прогнозирование временных рядов. ################################# ## Результаты ################################# Мы проводили эксперименты с полусинтетическими данными ситуаций COVID-19, синтетическими вариантами фармакологических динамик и реальными случаями. Метод ODE-Diff показал высокую точность в точных прогнозах и распределениях. Он сравнивался с сильными базисными моделями и показал значительное улучшение в качестве предсказания. Эти результаты подтверждают эффективность нашего подхода в сложных ситуациях, когда данные ограниченны. ################################# ## Значимость ################################# Прогнозирование контрфактических распределений является важной задачей во многих областях, включая общественное здравоохранение, медицину и финансы. Метод ODE-Diff предлагает новый подход, который объединяет механизмы и данные, улучшая прогнозирование и возможности каузального вывода. Это может привести к значительным улучшениям в моделировании и принятии решений в различных сферах. ################################# ## Выводы ################################# Мы представили новую модель, ODE-Diff, которая использует диффузию временных рядов и структурированные признаки из экспертных моделей для улучшения прогнозирования временных рядов. Результаты показали, что наш подхо
Annotation:
Predicting counterfactual distributions in complex dynamical systems is essential for scientific modeling and decision-making in domains such as public health and medicine. However, existing methods often rely on point estimates or purely data-driven models, which tend to falter under data scarcity. We propose a time series diffusion-based framework that incorporates guidance from imperfect expert models by extracting high-level signals to serve as structured priors for generative modeling. Our ...
ID: 2508.13355v1 cs.LG, cs.AI, stat.ME
Показано 1 - 10 из 14 записей