📊 Статистика дайджестов
Всего дайджестов: 34022 Добавлено сегодня: 0
Последнее обновление: сегодня
📄 Transferring Causal Effects using Proxies
2025-11-01Авторы:
Manuel Iglesias-Alonso, Felix Schur, Julius von Kügelgen, Jonas Peters
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
We consider the problem of estimating a causal effect in a multi-domain
setting. The causal effect of interest is confounded by an unobserved
confounder and can change between the different domains. We assume that we have
access to a proxy of the hidden confounder and that all variables are discrete
or categorical. We propose methodology to estimate the causal effect in the
target domain, where we assume to observe only the proxy variable. Under these
conditions, we prove identifiability (even w...
Авторы:
Huiyang Yi, Yanyan He, Duxin Chen, Mingyu Kang, He Wang, Wenwu Yu
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Causal discovery aims to learn causal relationships between variables from
targeted data, making it a fundamental task in machine learning. However,
causal discovery algorithms often rely on unverifiable causal assumptions,
which are usually difficult to satisfy in real-world data, thereby limiting the
broad application of causal discovery in practical scenarios. Inspired by these
considerations, this work extensively benchmarks the empirical performance of
various mainstream causal discovery al...
📄 Data-Augmented Few-Shot Neural Stencil Emulation for System Identification of Computer Models
2025-08-29Авторы:
Sanket Jantre, Deepak Akhare, Xiaoning Qian, Nathan M. Urban
## Контекст
Научные исследования часто используют PDE (частичные дифференциальные уравнения) для моделирования систем, например, в климатологии, гидрологии и динамике систем. Однако существуют проблемы с эффективностью и точностью решения PDE с использованием традиционных методов. Эти проблемы могут быть решены с помощью нейронных PDE, где нейронные сети заменяют часть или весь набор уравнений. Такие подходы легче взаимодействовать с нейронными сетями, удобнее для задач устойчивости и неопределенности. Однако обучение таких моделей требует больших данных, требующих значительных вычислительных ресурсов. Проект предлагает новую, эффективную стратегию получения данных для обучения нейронных сетей, которая уменьшает необходимость в дорогостоящих вычислениях.
## Метод
Метод основывается на развитии нового подхода к генерации данных для обучения нейронных PDE. Используется новая техника обучения, которая сэмулирует локальные "стенцил" состояния системы. Эта техника удаляет излишний спектр данных, которые не вносят значительных добавок в обучение. Данные генерируются с использованием синтетических симуляций, представляющих 10 шагов времени, что значительно экономит ресурсы. Эта техника также оценивает влияние дополнительных данных, которые могут быть получены из полной симуляции, когда такая доступна.
## Результаты
Исследование проверено на нескольких системах PDE, включая линейные и нелинейные модели. На основе сгенерированных синтетических данных были обучены нейронные сети, которые могут предсказывать решения PDE. Оказалось, что данные, созданные этим подходом, приводят к более точным моделям, чем традиционные методы. Особенно значительное преимущество было отмечено при использовании дополнительных данных из полной симуляции, которая необходима для сложных систем. Это позволило улучшить точность моделей на 10-15% в сравнении с конкурентными подходами.
## Значимость
Предложенный подход может применяться во многих областях, где требуется моделирование систем с помощью PDE, включая климатические модели, модели течения жидкости и другие. Основные преимущества включают эффективность в использовании ресурсов, улучшение точности и уменьшение времени обучения. Это может существенно повлиять на развитие теории и практики моделирования систем, позволяя быстро и эффективно разрабатывать модели для сложных систем.
## Выводы
Разработанный подход показал способность генерировать точные нейронные модели для PDE с минимальными вычислительными затратами. Он может быть использован для быстрого и эффективного моделирования сложных систем, вк
Annotation:
Partial differential equations (PDEs) underpin the modeling of many natural
and engineered systems. It can be convenient to express such models as neural
PDEs rather than using traditional numerical PDE solvers by replacing part or
all of the PDE's governing equations with a neural network representation.
Neural PDEs are often easier to differentiate, linearize, reduce, or use for
uncertainty quantification than the original numerical solver. They are usually
trained on solution trajectories obt...
📄 Position: Causal Machine Learning Requires Rigorous Synthetic Experiments for Broader Adoption
2025-08-14Авторы:
Audrey Poinsot, Panayiotis Panayiotou, Alessandro Leite, Nicolas Chesneau, Özgür Şimşek, Marc Schoenauer
## Контекст
Область исследования, известная как каузальное машинное обучение, предлагает объединить мощь машинного обучения с теорией каузального вывода для улучшения принятия решений. Однако, несмотря на свою значимость, эти методы остаются недостаточно использованы в широкой машинном обучении. Одной из основных причин является недостаточность того, как эффективность и надежность таких методов оцениваются в эмпирических исследованиях. Одним из критических аспектов является подход к синтетическим экспериментам, который, по мнению критиков, не позволяет тщательно оценить потенциал каузальных методов. Мы, наоборот, утверждаем, что синтетические эксперименты необходимы для точной оценки потенциала и надежности каузальных методов. Наши аргументы основываются на анализе существующих методов оценки и предложении принципов для проведения тщательных эмпирических исследований, используя синтетические данные. Эти принципы могут повысить доверие к каузальным методам и способствовать их более широкому применению.
## Метод
Методология, предложенная в статье, основывается на критическом анализе существующих методов оценки каузальных методов и предложении новых принципов для проведения синтетических экспериментов. Мы обосновываем, что синтетические эксперименты должны быть явно структурированы и должны отражать реальные сценарии применения, для того чтобы имитировать реальные задачи, с которыми сталкиваются при разработке каузальных моделей. Методы, описанные в статье, включают в себя предложение критериев для выбора синтетических данных, предложение способов моделирования каузальных отношений в этих данных и предложение мер для оценки надежности и точности моделей. Эти принципы стремятся к тому, чтобы обеспечить достоверные и всесторонние результаты в синтетических исследованиях, чтобы повысить уровень доверия к каузальным методам.
## Результаты
Результаты представлены в виде критического анализа существующих методов оценки каузальных моделей. Авторы предоставляют подробный обзор текущих методов, указывая на их недостатки, такие как несогласованность в выборе данных, недостаток ясности в моделировании каузальных отношений и нехватка мер для оценки надежности. Далее, авторы предлагают свои собственные принципы для проведения синтетических экспериментов. Эти принципы включают в себя подробные рекомендации по выбору данных, моделированию каузальных отношений и оценке результатов. Исследования подтверждают, что применение предложенных принципов может улучшить качество синтетических экспериментов и, следовательно, увеличить уровень доверия к каузальным методам.
## Значимость
Annotation:
Causal machine learning has the potential to revolutionize decision-making by
combining the predictive power of machine learning algorithms with the theory
of causal inference. However, these methods remain underutilized by the broader
machine learning community, in part because current empirical evaluations do
not permit assessment of their reliability and robustness, undermining their
practical utility. Specifically, one of the principal criticisms made by the
community is the extensive use of...