📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня

📄 Bayesian Nonparametric Dynamical Clustering of Time Series

2025-10-10

Авторы:

Adrián Pérez-Herrero, Paulo Félix, Jesús Presedo, Carl Henrik Ek

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

We present a method that models the evolution of an unbounded number of time series clusters by switching among an unknown number of regimes with linear dynamics. We develop a Bayesian non-parametric approach using a hierarchical Dirichlet process as a prior on the parameters of a Switching Linear Dynamical System and a Gaussian process prior to model the statistical variations in amplitude and temporal alignment within each cluster. By modeling the evolution of time series patterns, the method ...

ID: 2510.06919v1 stat.ML, cs.AI, cs.LG, stat.AP, I.5; I.2.1

arXiv PDF

📄 Efficient Prediction of Pass@k Scaling in Large Language Models

2025-10-09

Авторы:

Joshua Kazdan, Rylan Schaeffer, Youssef Allouah, Colin Sullivan, Kyssen Yu, Noam Levi, Sanmi Koyejo

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Assessing the capabilities and risks of frontier AI systems is a critical area of research, and recent work has shown that repeated sampling from models can dramatically increase both. For instance, repeated sampling has been shown to increase their capabilities, such as solving difficult math and coding problems, but it has also been shown to increase their potential for harm, such as being jailbroken. Such results raise a crucial question for both capability and safety forecasting: how can one...

ID: 2510.05197v1 cs.AI, cs.LG, stat.AP, stat.ML

arXiv PDF

📄 Domain-Shift-Aware Conformal Prediction for Large Language Models

2025-10-09

Авторы:

Zhexiao Lin, Yuanyuan Li, Neeraj Sarna, Yuanyuan Gao, Michael von Gablenz

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Large language models have achieved impressive performance across diverse tasks. However, their tendency to produce overconfident and factually incorrect outputs, known as hallucinations, poses risks in real world applications. Conformal prediction provides finite-sample, distribution-free coverage guarantees, but standard conformal prediction breaks down under domain shift, often leading to under-coverage and unreliable prediction sets. We propose a new framework called Domain-Shift-Aware Confo...

ID: 2510.05566v1 stat.ML, cs.AI, cs.CL, cs.LG, stat.AP

arXiv PDF

📄 On Using Large Language Models to Enhance Clinically-Driven Missing Data Recovery Algorithms in Electronic Health Records

2025-10-08

Авторы:

Sarah C. Lotspeich, Abbey Collins, Brian J. Wells, Ashish K. Khanna, Joseph Rigdon, Lucy D'Agostino McGowan

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Objective: Electronic health records (EHR) data are prone to missingness and errors. Previously, we devised an "enriched" chart review protocol where a "roadmap" of auxiliary diagnoses (anchors) was used to recover missing values in EHR data (e.g., a diagnosis of impaired glycemic control might imply that a missing hemoglobin A1c value would be considered unhealthy). Still, chart reviews are expensive and time-intensive, which limits the number of patients whose data can be reviewed. Now, we inv...

ID: 2510.03844v1 cs.LG, stat.AP, stat.ME

arXiv PDF

📄 Structural Refinement of Bayesian Networks for Efficient Model Parameterisation

2025-10-04

Авторы:

Kieran Drury, Martine J. Barons, Jim Q. Smith

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Many Bayesian network modelling applications suffer from the issue of data scarcity. Hence the use of expert judgement often becomes necessary to determine the parameters of the conditional probability tables (CPTs) throughout the network. There are usually a prohibitively large number of these parameters to determine, even when complementing any available data with expert judgements. To address this challenge, a number of CPT approximation methods have been developed that reduce the quantity an...

ID: 2510.00334v1 stat.ME, cs.AI, cs.LG, stat.AP, 62H22, 62C99, 68T30, 68T37

arXiv PDF

📄 The causal structure of galactic astrophysics

2025-10-04

Авторы:

Harry Desmond, Joseph Ramsey

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Data-driven astrophysics currently relies on the detection and characterisation of correlations between objects' properties, which are then used to test physical theories that make predictions for them. This process fails to utilise information in the data that forms a crucial part of the theories' predictions, namely which variables are directly correlated (as opposed to accidentally correlated through others), the directions of these determinations, and the presence or absence of confounders t...

ID: 2510.01112v1 astro-ph.GA, astro-ph.CO, cs.LG, stat.AP, stat.ME

arXiv PDF

📄 COMPASS: Robust Feature Conformal Prediction for Medical Segmentation Metrics

2025-09-30

Авторы:

Matt Y. Cheung, Ashok Veeraraghavan, Guha Balakrishnan

## Контекст В клинических приложениях, ценность сегментационных моделей часто определяется достоверностью полученных внешней метрики, таких как размер органа, а не пиксельной точностью сегментационных масок. Таким образом, квантификация неопределенности для таких метрик является критически важной для принятия обоснованных решений. Конформное предсказание (CP) — это популярная фреймворк для вывода подобных гарантий неопределенности, однако применение CP в непосредственном виде к окончательной скалярной метрике является неэффективным, так как он рассматривает нелинейную пайплайн сегментации-к-метрике в качестве черного ящика. Мы предлагаем COMPASS, усовершенствованный фреймворк, который генерирует эффективные, метрические CP-интервалы для изображений сегментации, используя индуктивные подсказки от глубоких нейронных сетей. COMPASS выполняет калибровку непосредственно в пространстве моделей представления, изменяя внутренние черты вдоль низкоразмерных подпространств, максимально чувствительных к целевой метрике. Мы доказали, что COMPASS обеспечивает достоверную покрытие маргинальное в случае заменяемости и вложенного свойства. ## Метод COMPASS является продвинутым подходом к квантификации неопределенности для метрик сегментации, используя мощь глубоких нейронных сетей. Он переносит процесс калибровки непосредственно в пространство внутренних представлений модели, а не работает с метрикой в качестве черного ящика. Основная идея заключается в использовании переноса представлений модели для построения валидных интервалов CP. Мы используем технологию переноса функций, чтобы определить низкоразмерные подпространства, которые имеют наибольшее влияние на целевую метрику. Эти подпространства используются для проведения калибровочных изменений, чтобы построить CP-интервалы. Мы доказали, что этот подход сохраняет валидность покрытия с учетом обменности и вложенности. ## Результаты Мы проверили эффективность COMPASS на четырёх задачах медицинской сегментации, включая оценку площади глаза и анатомических структур. Результаты показали, что COMPASS генерирует значительно тоньшие интервалы по сравнению с традиционными методами CP. Мы также продемонстрировали, что COMPASS поддерживает достоверность процедуры при ковариатных сдвигах, используя внутренние представления для оценки весов важности. Это доказывает, что COMPASS может обеспечить достоверную квантификацию неопределенности, даже в условиях изменения входных данных. ## Значимость COMPASS может применяться в медицинских приложениях для улучшения достоверности клинических определений, основанных на сегментационных моделях. Его преим

Annotation:

In clinical applications, the utility of segmentation models is often based on the accuracy of derived downstream metrics such as organ size, rather than by the pixel-level accuracy of the segmentation masks themselves. Thus, uncertainty quantification for such metrics is crucial for decision-making. Conformal prediction (CP) is a popular framework to derive such principled uncertainty guarantees, but applying CP naively to the final scalar metric is inefficient because it treats the complex, no...

ID: 2509.22240v1 eess.IV, cs.CV, cs.LG, stat.AP, stat.ML

arXiv PDF

📄 Hybrid Pipeline SWD Detection in Long-Term EEG Signals

2025-09-26

Авторы:

Antonio Quintero Rincon, Nicolas Masino, Veronica Marsico, Hadj Batatia

## Контекст Абсенция — одна из самых распространенных форм эпилепсии, особенно у детей. Её основным электроенцефалографическим признаком являются спайк-анд-вей (SWD) — электрографические дисхронии, которые требуют внимательного анализа в течение протяженных электроэнцефалографических записей. Ранее, диагностика SWD требула долгого времени и была склонна к ошибкам, что мешало её эффективному контролю и лечению. Мы предлагаем новую методику, основанную на свёртке сигнала и статистической обработке, для автоматизированного скрининга SWD в длительных EEG-записях. ## Метод Мы предлагаем гибридный подход, который сочетает аналитические признаки с архитектурой малой нейронной сети. Первым шагом является удаление нормальной активности сигнала с помощью двухсторонней скользящей средней фильтрации. Оставшиеся компоненты анализируются с помощью статистических мер — среднего и стандартного отклонения. Эти значения формируют двумерный признаковый вектор для каждого 20-секундного окна сигнала. Далее, эти признаки обрабатываются с помощью легкой нейронной сети с одним скрытым слоем, которая различает нормальную активность от SWD. Метод был обучен на данных 780 монопольных каналов с 256 Гц частотой пробега, наблюдая 392 SWD-событий. ## Результаты Метод протестирован на записях 12 пациентов. Он показал высокую точность, т.к. 384 из 392 SWD-событий были надёжно обнаружены (сенситивность: 98%), при этом ложно-положительных событий было не много (специфичность: 96,2%). Главным достижением является удобность использования: как анализ, так и сеть могут работать в реальном времени без необходимости ручной настройки порогов. ## Значимость Наш подход может быть использован для эффективного скрининга SWD в длительных EEG-записях, даже у детей. Он значительно сокращает время и трудозатраты в отличии от ручных методов. Кроме того, метод легко внедрить в системы мониторинга, что делает его привлекательным для клинического применения. ## Выводы Наши результаты показывают, что аналитические признаки, обученная нейронная сеть и реальное время могут обеспечить надёжный SWD-диагноз. В дальнейших исследованиях мы планируем расширить применение нашего подхода к другим формам эпилепсии и сократить его необходимые ресурсы.

Annotation:

Spike-and-wave discharges (SWDs) are the electroencephalographic hallmark of absence epilepsy, yet their manual identification in multi-day recordings remains labour-intensive and error-prone. We present a lightweight hybrid pipeline that couples analytical features with a shallow artificial neural network (ANN) for accurate, patient-specific SWD detection in long-term, monopolar EEG. A two-sided moving-average (MA) filter first suppresses the high-frequency components of normal background activ...

ID: 2509.19387v1 eess.SP, cs.LG, stat.AP, stat.ML

arXiv PDF

📄 Enhancing Credit Default Prediction Using Boruta Feature Selection and DBSCAN Algorithm with Different Resampling Techniques

2025-09-26

Авторы:

Obu-Amoah Ampomah, Edmund Agyemang, Kofi Acheampong, Louis Agyekum

## Контекст Обработка кредитных дефолтов является ключевым аспектом в машинном обучении, особенно в области риск-менеджмента и финансового анализа. Данные об обслуживании кредитов часто склонны к несбалансированности, где клиенты со скрытыми дефолтами составляют минимальную часть общего количества данных. Это недостаток приводит к снижению точности моделей во время предсказания. Другая проблема заключается в выборе характеристик, которые могут негативно сказаться на качестве моделей. Из-за этого необходимо разработать эффективные методы для признакового отбора и методов балансировки данных для улучшения предсказаний кредитных дефолтов. ## Метод Методология исследования включает в себя несколько шагов. В качестве начального этапа проводится базовое сравнение ML-моделей на необработанных данных для определения линии базы. Затем, для балансировки данных используются техники SMOTE, SMOTE-Tomek и ADASYN. Для признакового отбора используется метод Boruta, который позволяет выделить существенные признаки. Для извлечения выбросов применяется алгоритм DBSCAN. Наконец, несколько ML-классификаторов, включая XGBoost, AdaBoost, Gradient Boosting Machines (GBM) и Light GBM, обучаются на этих данных для оценки. Все модели оцениваются по таким показателям качества, как ROC-AUC, PR-AUC, G-mean и F1-score. ## Результаты Исследование проводится на реальных данных об оценке кредитных дефолтов, доступных в репозитории University of Cleveland ML. Модель Boruta+DBSCAN+SMOTE-Tomek+GBM показала лучшие результаты среди всех моделей. Она достигла F1-score в 82.56%, G-mean в 82.98%, ROC-AUC в 90.90% и PR-AUC в 91.85%. Эти результаты превышают показатели других классификаторов и указывают на эффективность применения Boruta при отборе признаков, а также на выгоду от использования DBSCAN для обнаружения выбросов и SMOTE-Tomek для балансировки данных. ## Значимость Изученные методы могут быть применены в различных сферах, таких как финансовый анализ, риск-менеджмент и кредитные оценки. Они предоставляют более точные и надёжные методы для прогнозирования кредитных дефолтов, что позволяет уменьшить риск ошибочных оценок и улучшить управление рисками. Это также может положительно сказаться на оптимизации процессов принятия решений в финансовых организациях. ## Выводы Результаты исследования показывают, что методы Boruta для признакового отбора и DBSCAN для обнаружения выбросов эффективно могут быть использованы для улучшения предсказаний кредитных дефолтов. Будущие исследования могут сосредотачиваться на изучении других методов балансировки данных и расширении моделей для более сложных структур данных.

Annotation:

This study examines credit default prediction by comparing three techniques, namely SMOTE, SMOTE-Tomek, and ADASYN, that are commonly used to address the class imbalance problem in credit default situations. Recognizing that credit default datasets are typically skewed, with defaulters comprising a much smaller proportion than non-defaulters, we began our analysis by evaluating machine learning (ML) models on the imbalanced data without any resampling to establish baseline performance. These bas...

ID: 2509.19408v1 cs.LG, stat.AP

arXiv PDF

📄 High-Dimensional Statistical Process Control via Manifold Fitting and Learning

2025-09-26

Авторы:

Burak I. Tas, Enrique del Castillo

## Контекст В Statistical Process Control (SPC) существуют сложности при мониторинге высокомерных динамических процессов, которые неявно лежат на низкомерной многообразии. Традиционные методы SPC, ориентированные на линейную редукцию размерности, часто не эффективны в высокомерных случаях. Это связано с тем, что низкое размерностное упрощение может привести к потере информации. Необходимо развитие моделей, которые эффективно работали бы с высокомерными данными, учитывая их низкомерную природу. ## Метод Для решения этой проблемы предлагается два подхода: 1. **Мониторинг на основе многообразия (manifold fitting)**: Данные аппроксимируются нелинейной структурой в высокомерном пространстве, а затем отслеживается отклонение от этого максимума. Это достигается с помощью нового скалярного, распределения-свободного, контрольного листа. 2. **Мониторинг на основе низкого размерного пространства (manifold learning)**: Данные эмбеддируются в низкомерное пространство, после чего отслеживаются отклонения в этом пространстве. Это подход близок к традиционным SPC-методам. Каждый метод доказывает свою возможность контролируемых тип-I ошибок, а затем сравнивается по природе и эффективности мониторинга. ## Результаты Эксперименты проводились на синтетических и реальных данных, включая процесс Tennessee Eastman. Метод мониторинга на основе многообразия показал высокую эффективность в мониторинге и детектировании аномалий, даже лучше tradition-based manifold learning. Для реальных данных, например, изображений электрических комутаторов, показано, что этот подход способен успешно обнаруживать поверхностные дефекты. ## Значимость Найденные результаты имеют широкое применение в промышленности, особенно в SPC, где необходимо анализ высокомерных динамических данных. Многообразие-фиттинг значительно улучшает мониторинг, повышая скорость и точность, и доказывает эффективность в реальных условиях. ## Выводы Предложенные методы мониторинга SPC, основанные на многообразии, демонстрируют высокую эффективность в динамических высокомерных процессах. Модель мониторинга на основе многообразия-фиттинга показывает более высокую точность и скорость в детектировании аномалий по сравнению с традиционными подходами. Будущие исследования будут фокусироваться на расширении этого подхода для более сложных промышленных процессов и на более глубоком исследовании интеграции многообразия-фиттинга в SPC.

Annotation:

We address the Statistical Process Control (SPC) of high-dimensional, dynamic industrial processes from two complementary perspectives: manifold fitting and manifold learning, both of which assume data lies on an underlying nonlinear, lower dimensional space. We propose two distinct monitoring frameworks for online or 'phase II' Statistical Process Control (SPC). The first method leverages state-of-the-art techniques in manifold fitting to accurately approximate the manifold where the data resid...

ID: 2509.19820v1 stat.ML, cs.LG, stat.AP

arXiv PDF

Показано 31 - 40 из 70 записей