📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня
Авторы:

Bahar Kor, Bipin Gaikwad, Abani Patra, Eric L. Miller

#### Контекст В последние годы выигрывает важность задачи наиболее быстрого обнаружения изменений (Change Point Detection, CPD) во временных рядах, которая находит применение в различных областях, включая мониторинг парковочных мест, системы мониторинга здоровья, мониторинг транспортных систем и анализ рынков финансов. Однако существующие подходы часто сталкиваются с ограничениями, такими как необходимость использования многоканальных видео, требование ручного маркирования данных, ограниченная скорость обработки и использование методов, не способных обнаруживать глобальные изменения в системах с неизвестным числом или систематически меняющимся поведением субъектов. Эти ограничения становятся критичными в ситуациях, где необходимо анализировать сложные многоагентные системы, такие как толпы людей. Мы предлагаем рамку для решения этой проблемы, которая адресует эти проблемы, обеспечивая эффективность в реальном времени и повышая масштабируемость. #### Метод Мы предлагаем рамку для непрерывного исследования изменений в многоагентных системах, основанную на интерпретируемых и самостоятельных методах. Наш подход включает в себя автоэнкодеры на основе ошибки реконструкции для вычисления Индивидуального Отклонения от Нормальности (Individual Deviation from Normality, IDfN). Для системного мониторинга мы собираем эти оценки в значимость на уровне системы с помощью среднего, дисперсии и гауссовых оценок (Kernel Density Estimates, KDE), предоставляя System-Wide Anomaly Score (SWAS). Далее, глобальные изменения обнаруживаются с помощью статистических мер и технологии Cumulative Sum (CUSUM). Наш подход отличается тем, что не требует метки данных или предварительной обработки, а также не требует экспертного знания. Он может работать в реальном времени с входными данными, поступающими в поток. #### Результаты Мы использовали синтетические данные и моделирование толп реализованное в Unity для проверки нашего подхода. Эксперименты показали, что наш метод выявляет системные изменения, даже если у него нет предварительного понимания количества субъектов или их поведения. Мы также сравнили наш подход с существующими решениями, показав наилучшие результаты в обнаружении системных изменений в течение нескольких десятков секунд после их наступления. Наши результаты подтверждают то, что метод является точным, быстрым и масштабируемым для мониторинга сложных многоагентных систем. #### Значимость Предлагаемый подход имеет широкие приложения в области обнаружения выбросов и мониторинга временных рядов в сложных системах, включая мониторинг транспортных систем, системы мониторинга здоровья и мониторинг толп. Наш подход обеспечива
Annotation:
We propose a framework for online Change Point Detection (CPD) from multi-entity, multivariate time series data, motivated by applications in crowd monitoring where traditional sensing methods (e.g., video surveillance) may be infeasible. Our approach addresses the challenge of detecting system-wide behavioral shifts in complex, dynamic environments where the number and behavior of individual entities may be uncertain or evolve. We introduce the concept of Individual Deviation from Normality (ID...
ID: 2509.18310v1 eess.SP, cs.LG, stat.AP, stat.ME
Авторы:

Manuel Noseda, Alberto De Luca, Lukas Von Briel, Nathan Lacour

#### Контекст Финансовые рынки представляют собой сложную среду, характеризующуюся высокой нерегулярностью и неизбежной неопределенностью. Одним из ключевых задач, стоящих перед исследователями, является прогнозирование тенденций этих рынков. Несмотря на то, что искусственные нейронные сети, такие как Long Short-Term Memory (LSTM), доказали свою эффективность в этой области, использование централизованных подходов может сталкиваться с рядом проблем. Эти проблемы включают затрудненный доступ к данным из-за конфиденциальности и юридических ограничений, а также высокую стоимость централизованного обработки данных. Таким образом, необходимо развивать альтернативные подходы, которые обеспечат доступ к богатым данным, обеспечивают безопасность и сохраняют приватность. #### Метод Для расследования этих вопросов, мы применяем технологию Federated Learning (FL). В нашем исследовании используется LSTM-классификатор для бинарной классификации тенденций финансовых рынков. Рассматриваются три сценария: (i) централизованный подход, в котором все данные объединяются в единый набор для обучения, (ii) модель, обучающаяся на отдельных подмножествах данных каждого агента, и (iii) распределенная FL, где участники обмениваются только модельными обновлениями, никогда не поделясь напрямую сырыми данными. Для добавления реальности, мы вводим независимые и идентично распределенные данные (non-IID) между агентами, а также применяем методы личностной лингвистики и дифференциальной приватности. #### Результаты Наши эксперименты показывают, что Federated Learning демонстрирует такую же точность и общезначимость, как и централизованная модель, но при этом эффективнее, чем модель, обучающаяся на отдельных данных каждого агента. Мы также проверяем FL в условиях независимых и идентично распределенных данных (non-IID), когда данные у каждого агента отличаются по своим характеристикам. Добавление дополнительных финансовых признаков и использование дифференциальной приватности позволяют улучшить общую производительность системы и обеспечить более точный прогноз. #### Значимость Наше исследование продемонстрировало, что Federated Learning может быть применен в финансовой сфере для бинарной классификации тенденций финансовых рынков с успехом. Этот подход обеспечивает совместную выгоду для всех участников, не требуя обмена сырыми данными, что значительно снижает риски со стороны приватности. Благодаря FL могут быть использованы более обширные данные для прогнозирования, без необходимости централизованной обработки. Это может иметь прямое применение в таких областях, как риск-менеджмент, финансовое
Annotation:
This paper studies Federated Learning (FL) for binary classification of volatile financial market trends. Using a shared Long Short-Term Memory (LSTM) classifier, we compare three scenarios: (i) a centralized model trained on the union of all data, (ii) a single-agent model trained on an individual data subset, and (iii) a privacy-preserving FL collaboration in which agents exchange only model updates, never raw data. We then extend the study with additional market features, deliberately introdu...
ID: 2509.16393v1 cs.LG, stat.AP
Авторы:

Niál Perry, Peter P. Pedersen, Charles N. Christensen, Emanuel Nussli, Sanelma Heinonen, Lorena Gordillo Dagallier, Raphaël Jacquat, Sebastian Horstmann, Christoph Franck

## Контекст Обнаружение урбанизированных горячих точек загрязнения воздуха является ключевым подходом для мониторинга и уменьшения воздействия антропогенных источников на здоровье и окружающую среду. Ранее, это делалось с помощью стационарных сенсоров или спутниковых данных. Однако, эти методы имеют ограничения, такие как недостаточное разрешение, высокая стоимость и недостаточное покрытие. Другой подход включает в себя использование низкозатратных мобильных сенсоров, которые могут собирать данные о PM$_{2.5}$ на протяжении всего города. Несмотря на это, выявление горячих точек загрязнения воздуха из данных с мобильных сенсоров является сложной задачей из-за неравномерности способа покрытия, вариаций фонового качества воздуха и динамических источников загрязнения. ## Метод Метод, предложенный в данном исследовании, предназначен для выявления горячих точек загрязнения воздуха в городах и состоит из четырех шагов. На первом шаге, гражданские ученые оснащаются мобильными сенсорами PM$_{2.5}$, которые они используют во время деятельности в городе. На втором шаге, признаки нормализуются, чтобы удалить влияние фоновой культурной загрязненности. На третьем шаге, данные подвергаются моделированию с использованием регрессии Гауссовских процессов, которая предоставляет проблему поиска горячих точек загрязнения как задачу классификации. На последнем шаге, вычисляется градиентный обзор горячих точек города на основе географического пространства, что позволяет узнать значительные участки с высокими уровнями загрязнения. ## Результаты Метод был применен для построения первого карты PM$_{2.5}$-загрязнения в Кигали, Руанда, на разрешении 200 метров. Результаты показали, что уровень загрязнения воздуха в Кигали значительно превышает нормативные пределы. Также были выявлены горячие точки, где уровень загрязнения постоянно превышает среднее в городе. Для оценки эффективности метода, проведенные эксперименты включили моделирование данных мобильного сенсора в Беижинге, Китай, где показали, что прогнозные точки горячих точек находятся в почти проходящем соответствии с реальными уровнями загрязнения. Этот подход позволяет оптимизировать обнаружение горячих точек загрязнения воздуха и повысить уровень аккуратности. ## Значимость Исследование демонстрирует значимые возможности низкозатратных мобильных сенсоров для мониторинга качества воздуха в городах. Оно может быть использовано для мониторинга качества воздуха в городах в любом месте мира, где могут быть ог
Annotation:
Low-cost mobile sensors can be used to collect PM$_{2.5}$ concentration data throughout an entire city. However, identifying air pollution hotspots from the data is challenging due to the uneven spatial sampling, temporal variations in the background air quality, and the dynamism of urban air pollution sources. This study proposes a method to identify urban PM$_{2.5}$ hotspots that addresses these challenges, involving four steps: (1) equip citizen scientists with mobile PM$_{2.5}$ sensors while...
ID: 2509.17175v1 cs.LG, stat.AP, 62P12, I.2.6
Авторы:

Zelong Bi, Pierre Lafaye de Micheaux

## Контекст Многие достоверные данные в естественных и искусственных системах показывают низкомерую структуру, несмотря на то, что они записаны в высокомерном пространстве. Это так называемое манифолдовое предположение (manifold hypothesis) объясняет, что такие данные часто лежат близко к низкомерному манифолду. Оценивание размерности этого манифолда является ключевым элементом для использования его структуры в машинном обучении и других задачах. Однако существующие методы оценки размерности манифолда широко разрознены и не подвергались систематической оценке. Наша мотивация заключается в том, чтобы определить наилучшие практики и сформулировать рекомендации для практиков и теоретиков в этой области. ## Метод Мы основываем наш подход на восемь представительных разновидностей методов оценки размерности манифолда, включая методы геометрических характеристик, линейных алгоритмов, и теории случайных лесов. Для оценки каждого метода мы разрабатываем контролируемые эксперименты, используя синтетические данные с управляемой размерностью, шумом и кривизной. Эти эксперименты позволяют проверить как отдельные факторы, так и их взаимодействие. Мы также рассматриваем реальные данные с различными структурами и проводим обобщенную оценку методов. Чтобы обеспечить принципиальный подход к гиперпараметровую оптимизацию, мы реализуем техники подбора, такие как кросс-валидация и градиентный поиск. ## Результаты Наши эксперименты показывают, что качество оценки размерности манифолда сильно зависит от уровня шума, кривизны манифолда, и размера выборки. Мы выясняем, какие методы показывают наилучший результат в зависимости от этих факторов. На реальных данных мы проверяем как общую эффективность, так и специфичность каждого метода. Наши результаты также включают стратегию гиперпараметрового подбора, которая позволяет максимизировать качество оценки в зависимости от конкретной структуры данных. Общие выводы указывают, что простые методы часто превосходят более сложные в условиях реальных данных. ## Значимость Результаты нашего исследования имеют большое значение для многих областей, включая обучение на основе манифолдов, распознавание образов, и анализ данных. Мы предлагаем практические рекомендации для выбора методов и гиперпараметров в зависимости от свойств данных. Наши находки могут улучшить эффективность и точность многих приложений, в которых используется манифолдовая структура данных. Будущие исследования могут сфокусироваться на развитии более точных и универса
Annotation:
The manifold hypothesis suggests that high-dimensional data often lie on or near a low-dimensional manifold. Estimating the dimension of this manifold is essential for leveraging its structure, yet existing work on dimension estimation is fragmented and lacks systematic evaluation. This article provides a comprehensive survey for both researchers and practitioners. We review often-overlooked theoretical foundations and present eight representative estimators. Through controlled experiments, we a...
ID: 2509.15517v1 cs.LG, stat.AP
Авторы:

Ahcène Boubekki, Konstantinos Patlatzoglou, Joseph Barker, Fu Siong Ng, Antônio H. Ribeiro

## Контекст Электрокардиограммы (ECG) широко используются для диагностики и мониторинга сердечных заболеваний. Недавние прорывы в области сверточных нейронных сетей (CNN) позволили автоматизировать процессы анализа ECG, включая аннотацию, скрининг заболеваний и прогнозирование их течения. Однако недостаток понятливости таких моделей ограничивает их применение в клинической практике. Без транспарентности интерпретировать результаты и выявлять клинически значимые эффекты становится затруднительно. Данная статья посвящена развитию нового подхода к объяснению результатов CNN в области ECG, который стремится добиться доверия к искусственным интеллектуальным системам и улучшить их вклад в клинический практику. ## Метод Метод, предложенный в работе, основывается на извлечении временно распределенных кластеров из внутренних представлений CNN. В процессе обучения сети эти кластеры выделяются в узлах сети, отвечающих за отдельные сегменты ECG. Каждый кластер соответствует определенному интервалу времени в сигнале и характеризуется показателями, описывающими его значимость. Для уменьшения неопределенности в представлении, авторы используют методы фиксации вариации, обеспечивающие квантификацию точности выделенных кластеров. Это позволяет визуализировать вклад каждого сегмента ECG в прогноз модели и оценивать уровень надежности решений. ## Результаты Исследование включало в себя эксперименты с различными моделями CNN, обученными на больших данных ECG. Метод показал, что модели выделяют ключевые интервалы сигнала, отвечающие за клинически важные отклонения. На примере изучения аритмий и инфаркта миокарда было продемонстрировано, что выделенные кластеры соответствуют известным электрофизиологическим утверждениям. Данные были обработаны с использованием методов статистической обработки и визуализации, позволивших проиллюстрировать вклад каждого кластера в модельное решение. Эксперименты показали, что метод обеспечивает высокую точность в определении клинически значимых эффектов. ## Значимость Предложенный подход может быть применен в различных областях, включая диагностику заболеваний сердца, раннее выявление нестабильных артериальной гипертензии и оценку эффективности лечения. Он предоставляет клиническим специалистам инструмент для проверки решений AI и понимания причин, по которым сеть пришла к определенному выводу. Это важно для повышения доверия к искусственным интеллектуальным системами в медицине. Кроме того, выделение временно распределенных кластеров может помочь в выявлении новых электрофизиологических закономерностей, способ
Annotation:
Deep learning has significantly advanced electrocardiogram (ECG) analysis, enabling automatic annotation, disease screening, and prognosis beyond traditional clinical capabilities. However, understanding these models remains a challenge, limiting interpretation and gaining knowledge from these developments. In this work, we propose a novel interpretability method for convolutional neural networks applied to ECG analysis. Our approach extracts time-localized clusters from the model's internal rep...
ID: 2509.15198v1 cs.LG, stat.AP, stat.ML
Авторы:

Kentaro Nakamura

## Контекст Одним из ключевых проблем в современном машинном обучении и использовании значительных языковых моделей (LLMs) является корректировка биаса при анализе неструктурированных данных, таких как тексты и изображения. Исследователи часто полагаются на методы линейной регрессии и аналогичные подходы для понимания зависимости между неструктурированными данными и структурированными переменными. Однако существующие методы часто сталкиваются с высокими стандартными ошибками, что ограничивает их точность. Эти ошибки часто требуют дополнительных усилий, таких как ошибки-меры, чтобы улучшить точность и стабильность результатов. Данная исследовательская работа рассматривает эти вызовы и предлагает новый подход, называемый Surrogate Representation Inference (SRI), для устранения этих проблем. ## Метод SRI основывается на гипотезе, что неструктурированные данные (например, тексты или изображения) полностью средят отношение между человеческим аннотированием и структурированными переменными. Это предположение гарантируется архитектурой модели, где человеческие кодеры используют только неструктурированные данные для подготовки аннотаций. Для выполнения этого, разработана нейронная сетевая архитектура, которая учитывает низкомерное представление неструктурированных данных, чтобы удовлетворять условию суррогатной представления. Если доступны несколько человеческих аннотаций, SRI также может корректировать недифференциальные ошибки измерения, которые могут возникать в них. Для текстовых результатов, SRI определяет условия идентификации и стратегии эффективного получения частично-параметрических оценок, позволяющих использовать низкомерное представление для улучшения точности интерпретации. ## Результаты Эксперименты проводились с использованием синтетических и реальных данных для оценки эффективности SRI. Для окружения текста-как-результата, SRI показал снижение стандартных ошибок над 50% при модерате аккуратности прогнозов моделей машинного обучения. Были также проведены эксперименты, показавшие, что SRI может корректировать недифференциальные ошибки измерения, что делает интерпретацию более надежной. Эти результаты продемонстрировали, что SRI может обеспечить достоверные выводы даже в условиях несовершенства человеческих аннотаций. ## Значимость Помимо использования в текстовых результатах, SRI может быть применено во многих областях, включая работы с изображениями, звуком и другими форматами неструктурированных данных. Основные преимущества SRI заключаются в снижении стандартных ошибок, улучшении точности интерпретации, а также в возможности использовать
Annotation:
As researchers increasingly rely on machine learning models and LLMs to annotate unstructured data, such as texts or images, various approaches have been proposed to correct bias in downstream statistical analysis. However, existing methods tend to yield large standard errors and require some error-free human annotation. In this paper, I introduce Surrogate Representation Inference (SRI), which assumes that unstructured data fully mediate the relationship between human annotations and structured...
ID: 2509.12416v1 cs.LG, stat.AP
Авторы:

Pratik Nag

## Контекст Область исследования связана с проблемами интерполяции и прогнозирования периодических данных, таких как предсказание погодных параметров, в том числе осадков. Эти задачи играют ключевую роль в сельскохозяйственной и гидрологической сферах, поскольку точности прогноза может зависеть безопасность жизнедеятельности и эффективность водопользования. Несмотря на развитие методов машинного обучения, особенно в области конвейерных сетей и глубокого обучения, остается вызов в обеспечении высокой точности и реалистичности систем прогнозирования. Например, в случае интерполяции предсказаний погодных параметров в полотне, возникают проблемы с разбросом данных, пропусками и неоднородностью разрешения. Одной из мотиваций для данного исследования является развитие моделей, которые могут корректно обрабатывать спектр этих сложностей. ## Метод Для решения проблемы интерполяции и прогноза является предложенный Spatio-temporal DeepKriging (STDK) фреймворк, который включает в себя нейронные сети, а именно ConvLSTM. Основная идея заключается в использовании видеосетей, которые в свою очередь могут обрабатывать временные ряды, а также географические данные. Данная модель базируется на свёрточных сетях, которые умеют хранить информацию об области в виде так называемых клетчатых карт, что позволяет им применить методы глубокого обучения для решения задач пространственного и временного анализа. Таким образом, STDK может учитывать спектр пространственных и временных зависимостей в данных, а также обеспечивать высокую точность интерполяции. Архитектура включает в себя несколько слоёв, которые обрабатывают данные зависимости в рамках временного и пространственного потока. ## Результаты Для проверки эффективности STDK, проведены обширные эксперименты на данных осадков в Европе. Результаты показывают, что модель показывает высокую точность в прогнозе, а также в соответствии с реальными данными. Измерялись не только точность интерполяции, но и уровень прогноза, что демонстрирует устойчивость модели к различным структурам данных. Данные были разбиты на тренировочную и проверочную выборку, что придало результаты более надежности. Были проведены сравнения с другими моделями, в частности с ConvLSTM и стандартными методами криггинга, чтобы подчеркнуть выигрыш в разрешении данных и достоверности результатов. ## Значимость Предложенная модель может быть применена в различных сферах, включая метеорологию, гидрологию и сельское хозяйство. Основные преимущества модели заключаются в высокой точности интерполяции и прогноза, а также в гибкости, которая позволяет применить её к различны
Annotation:
A detailed analysis of precipitation data over Europe is presented, with a focus on interpolation and forecasting applications. A Spatio-temporal DeepKriging (STDK) framework has been implemented using the PyTorch platform to achieve these objectives. The proposed model is capable of handling spatio-temporal irregularities while generating high-resolution interpolations and multi-step forecasts. Reproducible code modules have been developed as standalone PyTorch implementations for the interpola...
ID: 2509.12708v1 cs.LG, stat.AP
Авторы:

Srijesh Pillai, M. I. Jawid Nazir

## Контекст В последние годы отрасль матрасов-в-коробке (mattress-in-a-box) стала популярной в результате быстрого роста электронной коммерции. Основным принципом деятельности в этой отрасли является стратегия, основанная на маркетинге и конверсиях через каналы Direct-to-Consumer (DTC). Однако отрасль сталкивается с ограниченным количеством контрактных производителей матрасов в США. Это приводит к высокой степени зависимости от сторонних производителей, что делает ключевым управление сырьем, цепями поставок и инвентарем. Как указывается в рисунке 1, прогнозирование продаж в этой отрасли является критически важным для успешного управления запасами и оптимизации затрат. Однако существующие модели прогнозирования часто страдают от недостатка точности из-за недостатка специализированных параметров для отдельных товаров (SKU). В этом случае DemandLens предлагает инновационный подход к прогнозированию продаж, основанный на Prophet, который интегрирует метрики COVID-19 и продуктовские-специфические параметры оптимизации (SKU-specific hyperparameter optimization). Этот подход направлен на решение проблемы неточности прогноза, способствуя улучшению процессов управления запасами и потоков поставок в отрасли матрасов-в-коробке. ## Метод DemandLens основывается на Prophet, модели прогнозирования, разработанной Facebook, с добавлением специализированных параметров оптимизации (SKU-specific hyperparameter optimization). Prophet представляет собой автоматическую модель, которая может адаптироваться к разным типам данных и учитывать сезонность, тренды и интервалы. В нашей модели SKU-specific hyperparameter optimization добавляет дополнительную гибкость, позволяя настроить модель для каждого SKU по отдельности. Это приводит к более точным прогнозам, так как каждый SKU может иметь уникальные характеристики, такие как сезонность и тренды. COVID-19 metrics также внедрены в модель, чтобы учитывать влияние пандемии на потребление и спрос. Кроме того, мы использовали тренировочные данные из нескольких SKU, включая товары, которые были активно продавались в течение последних 12 месяцев. Эти данные были предобработаны для удаления выбросов и аномалий, чтобы обеспечить более точное прогнозирование. ## Результаты Мы провели эксперименты с множеством товаров (SKU), включая товары с высоким и низким объемом продаж. По результатам модель показала значительное улучшение прогнозной точности по сравнению с оригинальной моделью Prophet. Например, для товаров с высоким объемом продаж, точность прогноза увеличилась на 15-20%, а для товаров с низким объемом продаж, на 10-15%. Также мы выполнили A/B-тестирование с двумя вариантами прогнозирования: оригинальный Prophet и DemandLens. Тесты показали, что DemandLens приводит к более
Annotation:
DemandLens demonstrates an innovative Prophet based forecasting model for the mattress-in-a-box industry, incorporating COVID-19 metrics and SKU-specific hyperparameter optimization. This industry has seen significant growth of E-commerce players in the recent years, wherein the business model majorly relies on outsourcing Mattress manufacturing and related logistics and supply chain operations, focusing on marketing the product and driving conversions through Direct-to-Consumer sales channels. ...
ID: 2509.11085v1 cs.LG, stat.AP
Авторы:

Teresa Portone, Bert Debusschere, Samantha Yang, Emiliano Islas-Quinones, T. Patrick Xiao

## Контекст Вычислительно экспенсивные модели и модели с большим количеством входных параметров часто присутствуют в прикладных задачах. Исследования гибридных и сложных систем часто требуют оценки вклада каждого входа в выходную величину, чтобы понять систему и оптимизировать ее. Одним из стандартных подходов к такой оценке является анализ вариации (Sobol' analysis). Однако существующие методы обычно ограничены моделями с небольшим числом входов из-за больших потребностей в памяти или неэффективности в вычислениях. Необходимо развитие методов, которые бы позволяли работать с моделями с тысячами входов, не теряя точности и эффективности. ## Метод Расширения предложенного метода основываются на новых подходах к вычислению индексов Sobol'. Модели с большим количеством параметров требуют новых алгоритмов, которые не требуют хранения всех данных в памяти. Мы предлагаем алгоритм, обрабатывающий данные в потоке (streaming), что позволяет обрабатывать данные в батчах. Также мы предлагаем новую оптимизацию, которая сильно уменьшает необходимость в памяти, без потери точности. Для моделей с повторяющимися входами, мы предлагаем нестандартную партицию, которая адаптируется к таким случаям. Наш подход легко интегрируется с любыми моделями, включая сложные нейронные сети. ## Результаты Мы проводили эксперименты на двух примерах моделей с множеством входов, в том числе современных нейронных сетей. Мы сравнили наш подход с классическими методами и показали, что наши расширения не только эффективнее по памяти, но и дают точные результаты, примерно на одном уровне с традиционными. Наши вычислительные эксперименты демонстрируют, что модели с тысячами параметрами могут быть анализированы с большой точностью и без значительных изменений в архитектуре. В результате, мы увеличили эффективность и точность метода Sobol' для моделей с высокой сложностью. ## Значимость Наши расширения могут быть применены в различных областях, где требуется анализ вариации, например, в технике, экологии, финансах и биологии. Этот подход позволяет работать с моделями, которые ранее были слишком сложными для такого анализа. Мы также показали, что наш метод эффективен в случаях с нестандартными распределениями входных параметров. Это открывает новые возможности для исследований и применения анализа вариации в широких областях прикладных задач. ## Выводы Мы представили расширения метода Sobol' для вычислительно экспенсивных моделей. Мы предложили новые алгоритмы и методы хранения данных, которые позволяют обрабатывать модели с тысячами входов. Наши результаты демонстриру
Annotation:
Given-data methods for variance-based sensitivity analysis have significantly advanced the feasibility of Sobol' index computation for computationally expensive models and models with many inputs. However, the limitations of existing methods still preclude their application to models with an extremely large number of inputs. In this work, we present practical extensions to the existing given-data Sobol' index method, which allow variance-based sensitivity analysis to be efficiently performed on ...
ID: 2509.09078v2 stat.ML, cs.LG, stat.AP, stat.CO
Авторы:

Sanjay Basu, Sadiq Y. Patel, Parth Sheth, Bhairavi Muralidharan, Namrata Elamaran, Aakriti Kinra, Rajaie Batniji

#### Контекст Программы управления здоровьем населения (population health management), ориентированные на получателей Medicaid, требуют алгоритмической поддержки для координации долгосрочных мероприятий и услуг (таких как помощь в получении выгод, биопсихосоматическая помощь, обеспечение субсидий и плановое лечение). Эти программы должны обеспечивать безопасность, справедливость и прозрачность. Однако существуют сложности в создании моделей, которые бы защищали от адверсных результатов (например, неплановые поездки в стационар или административные хоспитализации), при этом сохраняя эффективность в выборе действий. Баланс между качеством и безопасностью является ключевым заданием для этих программ. #### Метод Мы предлагаем фреймворк Hybrid Adaptive Conformal Offline Reinforcement Learning (HACO), который отделяет моделирование риска от оптимизации предпочтений. HACO работает в два этапа: (i) риск рассеяности оценивается через соотношение нормализованных матричных расстояний между тренировочными и тестовыми данными, и (ii) оптимизация действий происходит в сфере безопасных рекомендаций. Это реализуется через подбор порогов для нейронных сетей (conformal thresholding), который скрывает рекомендации с высоким риском. Архитектура включает легковесный модель риска для адверсных событий и политику оптимизации для выбора рекомендаций. #### Результаты Используя дезидентифицированный датасет Waymark, HACO проводил 2.77 миллиона последовательных рекомендаций по работе с 168,126 пациентами. Результаты показали, что HACO может (i) строить модели риска с AUC ~0.81, (ii) строить калиброванные пороги для безопасных рекомендаций ({\tau} ~0.038 при {\alpha} = 0.10), и (iii) сохранять высокую покрытие безопасных действий. Аудит подкаталогов показал, что модели несколько отличаются в оценке значения в различных демографических категориях, что подтверждает важность справедливого аудита. #### Значимость HACO может применяться в различных областях, таких как биомедицинские решения, управление здоровьем населения, и системы социальной поддержки. Он обеспечивает безопасные, эффективные рекомендации, снижая риск адверсных событий. Благодаря интеграции conformal risk gating внутри offline RL, HACO предлагает новую модель для построения аудируемых и консервативных решений для повышения качества здравоохранения. #### Выводы Предложенный фреймворк HACO демонстрирует значительный успех в создании аудируемых и безопасных моделей для поддержки решений в управлении здоровьем населения. Будущие исследования будут сфокусированы на расширении моделей для более сложных задач, в том числе мультиагентных систем и адаптивного обучения в реальном времени.
Annotation:
Population health management programs for Medicaid populations coordinate longitudinal outreach and services (e.g., benefits navigation, behavioral health, social needs support, and clinical scheduling) and must be safe, fair, and auditable. We present a Hybrid Adaptive Conformal Offline Reinforcement Learning (HACO) framework that separates risk calibration from preference optimization to generate conservative action recommendations at scale. In our setting, each step involves choosing among co...
ID: 2509.09772v1 cs.LG, stat.AP
Показано 41 - 50 из 70 записей