📚 Саммари научных статей из arXiv

Найдено 385 результатов по запросу 'cs.LG, stat.ML' Сбросить поиск

📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня

📄 Unbiased Stochastic Optimization for Gaussian Processes on Finite Dimensional RKHS

2025-08-29

Авторы:

Neta Shoham, Haim Avron

## Контекст Оптимизация параметров ядер шумавых подборов (Gaussian Processes, GP) является ключевым аспектом их применения в машинном обучении и статистическом анализе. Одной из проблем является то, что многие методы обучения шумовых подборов, основанные на градиентном спуске, используют аппроксимации, отвлекающие от точного решения. Например, использование указателей указателей в стохастической вариационной инференции приводит к биазу и может ограничивать устойчивость решения. Это может привести к отклонению от стационарных точек стоимости логарифма-маргинальной вероятности. Мотивация для этого исследования лежит в необходимости развития методов, которые обеспечивают более точное и надежное обучение шумовых подборов. ## Метод Предлагаемый подход строится на идее точного стохастического вывода гауссовских процессов с использованием ядер, которые определяют репродуцируемое крестовое пространство Хильберта (RKHS) с конечной размерностью. Для этих ядер вводится метод, который позволяет проводить стохастическую инференцию с полной точностью. Для бесконечных RKHS, в то время как точность уменьшается, метод все еще достигает улучшенных результатов в сравнении с существующими аппроксимирующими методами. Для реализации, архитектура основывается на эффективном использовании хэш-функций для генерации случайных выборок, которые эффективно оценивают градиенты логарифма-маргинальной вероятности. ## Результаты Эксперименты показали, что подход позволяет достигать более высокого уровня точности и устойчивости по сравнению со существующими методами стохастического оптимизационного подхода. Это продемонстрировано на наборах данных из различных областей применения, включая регрессию и классификацию. Особенно заметны выигрыши в ситуациях, когда ресурсы памяти ограничены, что приводит к ограниченному размеру батча или количеству указателей указателей в существующих методах. ## Значимость Предложенный подход имеет значительное значение для областей, где точность и устойчивость оптимизации гауссовских процессов критичны. Это включает в себя широкие приложения, такие как моделирование и предсказание в сложных системах, а также в задачах, требующих доверительных прогнозов. Преимущества включают более точное определение шумовых подборов, чем указательные методы в стохастической вариационной инференции. Будущие исследования могут сфокусироваться на расширении этого подхода к более сложным моделям и приложениям, где необходима высокая точность оптимизации. ## Выводы В данной статье был п

Annotation:

Current methods for stochastic hyperparameter learning in Gaussian Processes (GPs) rely on approximations, such as computing biased stochastic gradients or using inducing points in stochastic variational inference. However, when using such methods we are not guaranteed to converge to a stationary point of the true marginal likelihood. In this work, we propose algorithms for exact stochastic inference of GPs with kernels that induce a Reproducing Kernel Hilbert Space (RKHS) of moderate finite dim...

ID: 2508.20588v1 cs.LG, stat.ML

arXiv PDF

📄 Dimension Agnostic Testing of Survey Data Credibility through the Lens of Regression

2025-08-29

Авторы:

Debabrota Basu, Sourav Chakraborty, Debarshi Chanda, Buddha Dev Das, Arijit Ghosh, Arnab Ray

## Контекст Оценка достоверности выборочного опроса в представлении общности является ключевым для гарантии верности последующих исследований. Эта проблема часто сводится к оценке расстояния между двумя высокомерновыми распределениями, требующей большого числа выборок, которое растет экспоненциально с увеличением размерности. Однако модель, используемая для анализа данных, может привести к выводам, согласованным с различными методами моделирования. В этой статье предлагается задачно-ориентированный подход для оценки достоверности выборочного опроса, который меньше зависит от модели исследования. ## Метод Авторы предлагают модель-зависимый метрический подход для оценки достоверности. Основной метод заключается в использовании алгоритма для проверки достоверности данных в регрессионных моделях. Этот алгоритм не требует восстановления регрессионной модели и может оценивать достоверность данных независимо от их размерности. Метод основывается на работе с выборочными данными, а не на построении модели. ## Результаты Авторы проводят эксперименты, используя данные из регрессионных моделей. Они демонстрируют, что алгоритм эффективно определяет достоверность данных с помощью задачно-ориентированного подхода, не требующего восстановления модели. Эта эффективность проявляется в своей зависимости от данных, которая не зависит от их размерности. Эксперименты показывают, что алгоритм может быть применен в различных регрессионных моделях с высокой точностью. ## Значимость Предлагаемый подход может быть применен в различных областях, где необходима проверка достоверности данных, например, в экономике, социологии и статистике. Он обеспечивает более точную оценку достоверности данных, не требуя высокой размерности выборок. Это может привести к оптимизации процессов работы с данными в учебных, научных и практических задачах, снижая требования к объему выборочных данных. ## Выводы Авторы показали, что их подход эффективнее, чем традиционные методы, которые требуют восстановления модели. Они также сделали вывод, что дальнейшие исследования могут быть направлены на расширение этого подхода для других задач моделирования и тестирования достоверности данных.

Annotation:

Assessing whether a sample survey credibly represents the population is a critical question for ensuring the validity of downstream research. Generally, this problem reduces to estimating the distance between two high-dimensional distributions, which typically requires a number of samples that grows exponentially with the dimension. However, depending on the model used for data analysis, the conclusions drawn from the data may remain consistent across different underlying distributions. In this ...

ID: 2508.20616v1 cs.LG, stat.ML

arXiv PDF

📄 Supervised Stochastic Gradient Algorithms for Multi-Trial Source Separation

2025-08-29

Авторы:

Ronak Mehta, Mateus Piovezan Otto, Noah Stanis, Azadeh Yazdan-Shahmorad, Zaid Harchaoui

## Контекст Современные приложения в области акустики, биомедицины и цифровых систем часто сталкиваются с задачей выделения источников сигналов из смешанных данных. Эта задача, известная как многоканальная источниковая разделка (source separation), требует эффективных методов, чтобы извлечь целевые сигналы с минимальными ошибками. В существующих методах используется многоканальная супервайзированная инверсия (supervised inversion), которая основывается на предварительной информации о структуре сигналов. Однако традиционные подходы не полностью используют доступные супервайзированные данные, что приводит к ограниченным результатам в задачах разделки сигналов. Необходимо разработать методы, которые будут эффективно использовать доступные супервайзированные данные для улучшения точности и интерпретируемости решений. ## Метод Мы предлагаем супервайзированный стохастический градиентный метод для многоканальной источниковой разделки, который включает в себя многоканальное наблюдение (multi-trial supervision). Основная идея заключается в объединении локального сглаживания, реализуемого через проксимальный градиент-тип, с обучением модели прогноза с помощью обратного распространения ошибки (backpropagation). Алгоритм работает в пространстве инверсий матриц, что позволяет ему эффективно работать с нелинейными задачами. Метод также включает в себя специальные математические техники для обеспечения стабильности и точности решений. Этот подход может быть подан в виде библиотеки для решения различных задач источниковой разделки, которые имеют доступ к супервайзированным данным. ## Результаты Мы провели эксперименты на синтетических и реальных данных, чтобы оценить эффективность предлагаемого метода. Для синтетических данных мы сравнили используемый подход с традиционными методами и получили значительное улучшение в точности разделки сигналов. На реальных данных, включающих задачи разделки звуков и сигналов из биологических источников, метод показал улучшение интерпретируемости изолированных компонент. Эксперименты также показали, что наличие дополнительных супервайзированных данных существенно повышает успешность решения нелинейных задач источниковой разделки. ## Значимость Предлагаемый подход имеет широкие области применения, в том числе в медицине для выделения сигналов из электроенцефалограмм (EEG) или электрокардиограмм (ECG), в цифровых системах для распознавания речи, а также в акустических приложениях для отделения звуков в сложных средах. Он предоставляет значительные преимущества перед традиционными методами, включая улучшение точности и интерпретируемо

Annotation:

We develop a stochastic algorithm for independent component analysis that incorporates multi-trial supervision, which is available in many scientific contexts. The method blends a proximal gradient-type algorithm in the space of invertible matrices with joint learning of a prediction model through backpropagation. We illustrate the proposed algorithm on synthetic and real data experiments. In particular, owing to the additional supervision, we observe an increased success rate of the non-convex ...

ID: 2508.20618v1 cs.LG, stat.ML

arXiv PDF

📄 Enhancing Trust-Region Bayesian Optimization via Newton Methods

2025-08-28

Авторы:

Quanlin Chen, Yiyu Chen, Jing Huo, Tianyu Ding, Yang Gao, Yuetong Chen

## Контекст Bayesian Optimization (BO) является эффективным подходом для оптимизации дорогостоящих черных-кассы функций, характеризующийся высокой семплированной эффективностью. Однако применение BO в высокомерных пространствах остается сложным из-за необходимости моделирования сложных целевых функций. Ранее предложенные методы, такие как TuRBO (Trust-Region Bayesian Optimization), используют локальные триггер-регионы для локального моделирования в суб-пространствах. Это позволяет избежать переуточнения и улучшить эффективность поиска. Однако у локальных Гауссовых процессов (GP) есть ограничения в семплировании, делая неэффективным работу в высокомерных пространствах. Наша мотивация заключается в развитии новых методов, которые сочетают локальное моделирование с высокой семплированной эффективностью в высокомерных пространствах. ## Метод Мы предлагаем новую модель, использующую глобальные Гауссовые процессы для построения локальных квадратичных моделей. На каждом шаге мы вычисляем градиенты и гессианы целевой функции в глобальном пространстве, а затем используем их для построения локальных моделей. Эти модели позволяют оптимизировать целевую функцию с помощью бунд-ограниченного квадратичного программирования. Эта модель позволяет улучшить семплирование, избежать переуточнения, и поддерживать модельные преимущества локальных GPs. Мы также разработали метод для обработки проблемы исчезающих градиентов в высокомерных пространствах, что дает повышенную точность в оптимизации. ## Результаты Мы проверили нашу модель на синтетических функциях и реальных задачах. Мы сравнили её с TuRBO и другими методами BO в высокомерных пространствах. Наши результаты показали, что производительность наших моделей значительно превышает TuRBO, даже при локальном моделировании. Мы также проанализировали влияние размера локальных триггер-регионов, стохастичности и других факторов на производительность. Наши результаты показали, что наш метод обеспечивает более точное моделирование и более эффективный поиск оптимума в высокомерных пространствах. ## Значимость Наш метод может применяться в различных областях, где требуется оптимизация дорогостоящих черных-кассы функций, например в научных исследованиях, инженерии, финансах и медицине. Он предоставляет преимущества в семплировании и моделировании, что делает его эффективным для high-dimensional optimization tasks. Мы считаем, что наш подход может повлиять на оптимизацию высокомерных функций, обеспечивая более точную и эффективную работу в сложных задачах. ## Выводы Мы предложили усовершенствованный подход к Trust-Region Bayesian Optimization, который использует

Annotation:

Bayesian Optimization (BO) has been widely applied to optimize expensive black-box functions while retaining sample efficiency. However, scaling BO to high-dimensional spaces remains challenging. Existing literature proposes performing standard BO in multiple local trust regions (TuRBO) for heterogeneous modeling of the objective function and avoiding over-exploration. Despite its advantages, using local Gaussian Processes (GPs) reduces sampling efficiency compared to a global GP. To enhance sam...

ID: 2508.18423v1 cs.LG, stat.ML

arXiv PDF

📄 Federated Learning with Heterogeneous and Private Label Sets

2025-08-28

Авторы:

Adam Breitholtz, Edvin Listo Zec, Fredrik D. Johansson

## Контекст Федеративное обучение (FL) представляет собой метод обучения глобальному модели на основе данных, распределенных между независимыми клиентами. Обычно в FL предполагается, что клиенты имеют независимые и сбалансированные меток для обучения. Однако в реальных приложениях это не всегда так: клиенты могут иметь разные, несовместимые метки или даже не желать делиться своими метками с другими клиентами. Эти ситуации — например, различных меток между клиентами в интернет-рекламе или в обработке медицинских данных — представляют собой значительную проблему для традиционных подходов FL. Несмотря на важность этой проблемы, в существующих исследованиях либо не рассматриваются, либо редко рассматриваются эти сценарии. Наша мотивация заключается в изучении эффектов различности меток (label set heterogeneity) на производительность модели в FL, а также в разработке методов, позволяющих улучшить этот аспект без ущерба для конфиденциальности клиентов. ## Метод Мы рассматриваем два основных сценария различности меток: **публичное** и **приватное**. В первом случае клиенты имеют доступ к общей множеству меток (то есть, клиенты могут видеть, какие метки имеют другие клиенты), тогда как во втором случае клиенты делят свои метки только с центральным сервером, но не друг с другом. Мы применяем классические методы для решения проблемы комбинирования классификаторов (classifier combination problem) в рамках FL, а также адаптируем существующие методы FL для приватных меток. Для этих целей мы используем методы, такие как **Federated Averaging (FedAvg)** и **FedProx**, которые адаптируются для работы с отличающимися метками. Кроме того, мы рассматриваем централизованный подход, при котором клиенты обучают свои модели с целью улучшения представительности (representational alignment), но этот подход часто приводит к более высокой вариативности результатов. ## Результаты Мы проводили эксперименты на различных датасетах, включая CIFAR-10 и CIFAR-100, для сравнения различных подходов в FL с различностью меток. Наши результаты показали, что сокращение количества меток для каждого клиента значительно снижает производительность всех методов, независимо от того, имеют ли клиенты публичные или приватные метки. Тем не менее, централизованный подход к улучшению представительности моделей помогает смягчить этот эффект, хотя в некоторых случаях он приводит к высокой вариативности. В то же время, наши адаптированные подходы FL для приватных меток показали почти одинаковую производительность в сравнении с методами FL в случае публичных меток. Это указывает на то, что клиенты могут получать приватность с минимальными затратами на точность модели. ## Значимост

Annotation:

Although common in real-world applications, heterogeneous client label sets are rarely investigated in federated learning (FL). Furthermore, in the cases they are, clients are assumed to be willing to share their entire label sets with other clients. Federated learning with private label sets, shared only with the central server, adds further constraints on learning algorithms and is, in general, a more difficult problem to solve. In this work, we study the effects of label set heterogeneity on ...

ID: 2508.18774v1 cs.LG, stat.ML

arXiv PDF

📄 The GINN framework: a stochastic QED correspondence for stability and chaos in deep neural networks

2025-08-28

Авторы:

Rodrigo Carmo Terin

#### Контекст Глубокие нейронайронные сети (DNNs) широко используются в машинном обучении и интеллектуальных технологиях. Однако определение устойчивости и стабильности широких DNNs остается вызовом, возникающим в результате сложности их интерпретации и регулирования. Это затрудняет понимание поведения таких сетей во время обучения и применения. Данная работа формулирует новую математическую модель, позволяющую описать поведение широких DNNs с помощью стохастического поля, связанного с квантовой электродинамикой (QED). Такой подход позволяет упростить модель, связать границы устойчивости с характером широких DNNs и дать новые инструменты для анализа и контроля сетей. #### Метод Методология, представленная в работе, основывается на строительстве топологического фиктивного поля, описывающего поведение DNNs в качестве стохастического квантового поля. Декомпозиция DNNs в модели с помощью фермионных материалов и гравитационных полей позволяет любую широкую DNN представить в виде комбинации физических полей, связанных с квантовой электродинамикой. Для решения задач стабилизации используется техника фиктивного Langevin-времени, чтобы нормализовать гауссовские взаимодействия глубинных сетей. Этот подход позволяет описать различные варианты динамики и стабилизации широких DNNs. #### Результаты Результаты экспериментов показали, что модель широких DNNs, основанная на физической модели квантовой электродинамики, дает точные предсказания поведения устойчивости сетей в зависимости от их ширины и регуляризации. Использованы стандартные многослойные перцептроны, где результаты были подтверждены через симуляции стохастических полей. Использование гауссианской симметрии и методики фиктивных временных интервалов позволило выделить характер широких DNNs и определить границы устойчивости. Кроме того, предложена новая GINN-модель с использованием параметризации величины и фазы весов, что дает гибкость в контроле устойчивости. #### Значимость Результаты работы имеют значительное значение для развития теории глубоких нейронных сетей. Модель стохастического поля дает новый подход к пониманию и контролю устойчивости DNNs в машинном обучении. Также, этот подход может применяться в различных областях, где требуется анализ стабильного поведения нейронных сетей, например, в глубоком обучении, градиентных подъемах и других алгоритмах. GINN, как модель, предоставляет новые инструменты для последовательного мониторинга и регулирования широких DNNs. #### Выводы Выводы работы указывают на успешное применение стохастич

Annotation:

The development of a Euclidean stochastic field-theoretic approach that maps deep neural networks (DNNs) to quantum electrodynamics (QED) with local U(1) symmetry is presented. Neural activations and weights are represented by fermionic matter and gauge fields, with a fictitious Langevin time enabling covariant gauge fixing. This mapping identifies the gauge parameter with kernel design choices in wide DNNs, relating stability thresholds to gauge-dependent amplification factors. Finite-width flu...

ID: 2508.18948v1 hep-th, cond-mat.dis-nn, cs.LG, stat.ML

arXiv PDF

📄 On the Edge of Memorization in Diffusion Models

2025-08-27

Авторы:

Sam Buchanan, Druv Pai, Yi Ma, Valentin De Bortoli

#### Контекст Диффузионные модели являются мощным инструментом в машинном обучении, применяемыми в сферах, таких как генерация изображений, звука и текста. Однако существуют некоторые проблемы, связанные с их работой. Например, эти модели могут не только генерировать новые данные, но и воспроизводить исходные данные, включая те, которые были использованы в ходе обучения. Это может привести к проблемам, таким как копирайтерские споры и нарушение конфиденциальности данных. Тем не менее, мало знакомо с точки зрения теории и практики, что определяет модели работы — то значительное внимание уделяется их возможности генерировать новые данные, но мало изучено, при каких условиях они могут воспроизводить имеющиеся. Этот вопрос не только теоретически интересен, но и имеет практическое значение для реального применения таких моделей в различных областях. #### Метод Мы предлагаем математическую модель, которая позволяет разделять факторы, влияющие на воспроизведение данных в диффузионных моделях. Особенностью нашего подхода является использование синтетических или натуральных изображений, которые служат исходным материалом для обучения моделей. Мы строим "математическую лабораторию", в которой проводятся эксперименты с разными моделями, обученными на разных наборах данных. Наша гипотеза заключается в том, что модель воспроизведет данные или же генерирует новые в зависимости от размера модели и характера обучения. Мы проверяем эту гипотезу, исследуя различия в поведении моделей при меняющемся размере параметров. #### Результаты Мы проводили эксперименты, в ходе которых использовали синтетические и натуральные данные для обучения моделей. Мы выявили, что при достаточно маленьких размерах моделей они полагаются на воспроизведение данных, чтобы минимизировать ошибку. Однако, когда размер модели достигает определенного критического уровня, они начинают генерировать новые данные. Мы также показали, что наша теория может предсказывать момент, когда модель переходит с воспроизведения к генерации, исходя из размера модели и её параметров. #### Значимость Наши результаты могут иметь большое значение в различных областях, где используются диффузионные модели. Например, в области генерации изображений, звука или текста, где важно понимать, могут ли модели воспроизвести исходные данные или же генерируют новые. Благодаря нашей теории можно предсказать, на каком этапе модель будет переходить от воспроизведения к генерации, что помогает в управлении проблемами копирайтерских споров или защиты конфиденциальности данных. #### Выво

Annotation:

When do diffusion models reproduce their training data, and when are they able to generate samples beyond it? A practically relevant theoretical understanding of this interplay between memorization and generalization may significantly impact real-world deployments of diffusion models with respect to issues such as copyright infringement and data privacy. In this work, to disentangle the different factors that influence memorization and generalization in practical diffusion models, we introduce a...

ID: 2508.17689v1 cs.LG, stat.ML

arXiv PDF

📄 Evaluating the Quality of the Quantified Uncertainty for (Re)Calibration of Data-Driven Regression Models

2025-08-27

Авторы:

Jelke Wibbeke, Nico Schönfisch, Sebastian Rohjans, Andreas Rauh

## Контекст В сегменте прикладных решений, требующих гарантированной надежности и точности, данные-опирающиеся модели должны не только точно прогнозировать, но и оценивать свою собственную неопределенность. Эта характеристика, называемая калибровкой, является критической для основания рискованных решений. В регрессии широко развит комплекс метрик и методов калибровки, которые предназначены для достижения этой цели. Однако метрики калибровки отличаются по определению, предпосылкам и масштабам, что создает проблемы при интерпретации и сравнении результатов из разных исследований. Более того, многие методы калибровки были протестированы только на ограниченном наборе метрик, что не позволяет судить о габаритах их улучшений в разных контекстах. Работа предлагает систематическую классификацию метрик калибровки, извлеченных из ранее опубликованных работ, и их независимую оценку в условиях стандартных экспериментов с настоящими, синтетическими и специально искаженными данными. Это позволяет выявить области, где метрики дают несогласованные или противоречивые результаты, что может привести к неправильным выводам в процессе рекалибровки. ## Метод В работе использована систематическая классификация и обобщение метрик калибровки, извлеченных из литературы. Были проанализированы широкий спектл метрик, включая статистические меры как Expected Normalized Calibration Error (ENCE), так и критерии, основанные на простоте, такие как Coverage Width-based Criterion (CWC). Для проверки этих метрик были проведены эксперименты с реальными, синтетическими и подделанными данными, которые имитируют различные ситуации некорректной калибровки. Для каждой метрики была определена ее значимость и точность в оценке калибровки моделей. Эта методология позволила создать объективный бенчмарк для сравнения различных методов калибровки и их метрик. ## Результаты Эксперименты показали, что многие метрики калибровки дают противоречивые результаты при оценке одних и тех же результатов. Например, ENCE и CWC приводят к разным выводам о качестве рекалибровки, что может привести к неточностям при принятии решений. Было обнаружено, что некоторые метрики дают высокую оценку калибровки для моделей, которые на самом деле некорректно оценивают неопределенность. Это свидетельствует о сильных конфликтах между метриками, которые могут использоваться для "выбора подходящих результатов" в зависимости от их определения. В целом, было установлено, что ENCE и CWC показали себя как наиболее надежные метрики в этом квадрате, но даже они не являются идеальными и не всегда сходятся в оценках. ## Значимость Результаты работы имеют практическое значение для разрабо

Annotation:

In safety-critical applications data-driven models must not only be accurate but also provide reliable uncertainty estimates. This property, commonly referred to as calibration, is essential for risk-aware decision-making. In regression a wide variety of calibration metrics and recalibration methods have emerged. However, these metrics differ significantly in their definitions, assumptions and scales, making it difficult to interpret and compare results across studies. Moreover, most recalibrati...

ID: 2508.17761v1 cs.LG, stat.ML, 68T37, 68T07, 62P30, 62G07, 62F15, I.2.6; G.3; I.5.1

arXiv PDF

📄 A Novel Framework for Uncertainty Quantification via Proper Scores for Classification and Beyond

2025-08-27

Авторы:

Sebastian G. Gruber

## Контекст Модели машинного обучения, особенно те, что используются в решении реальных задач, должны предоставлять надежный подход к оценке их неопределенности. Несмотря на то, что многие текущие методы могут излишне ограничиваться определенными типами задач, необходима общая рамочная модель, которая может быть применена к различным видам задач, включая классификацию, регрессию и генерирование. Неопределенность в таких моделях может быть разделена на две категории: априорная (алгоритмическая нестабильность) и апостериорная (неопределенность в выходных данных). Оценка таких неопределенностей является ключевым элементом для доверительного использования моделей в реальной жизни. Мы предлагаем новую фреймворкную модель, основанную на "proper scores", которая может быть применена к множеству задач. ## Метод Мы предлагаем новую методологию, основанную на "proper scores", функциях, которые могут быть использованы для оценки неопределенности по отдельности для регрессии, классификации и даже генерирования. Мы доказываем теоретические связи между эпистемической неопределенностью, алетиорической неопределенностью и калибровкой модели. Наш подход включает в себя новый декомпозиционный метод на основе векторных дивергенсов Брегмана, который позволяет более точно интерпретировать неопределенность в генерируемых моделях. Мы также предлагаем новые способы оценки калибровки и неопределенности в классификационных задачах, а также новый метод для сравнения различных подходов к оценке ошибок. Наш фреймворк включает в себя новую оценку "kernel spherical score" для генерируемых моделей в различных областях: изображения, звука и текста. ## Результаты Мы проверили нашу модель на различных задачах, включая генерирование изображений, звука и текста, используя "kernel spherical score" и другие методы. Мы показали, что наш подход более точен и интерпретируемый в сравнении с состоянием технологии. Например, мы улучшили оценку неопределенности в классификации используя новые способы подхода к "proper calibration errors". Мы также показали, что наш алгоритм для оценки неопределенности в генерируемых моделях превосходит текущие лучшие решения в области генерирования изображений, аудио и текстов. ## Значимость Наша модель может быть применена в широком кругу задач, включая классификацию, регрессию и генерирование. Она предлагает более гибкий и обобщенный подход к оценке неопределенности, чем существующие методы. Мы демонстрируем, что наш подход может быть использован для улучшения калиброванности и неопределенности моделей, что может прив

Annotation:

In this PhD thesis, we propose a novel framework for uncertainty quantification in machine learning, which is based on proper scores. Uncertainty quantification is an important cornerstone for trustworthy and reliable machine learning applications in practice. Usually, approaches to uncertainty quantification are problem-specific, and solutions and insights cannot be readily transferred from one task to another. Proper scores are loss functions minimized by predicting the target distribution. Du...

ID: 2508.18001v1 cs.LG, stat.ML

arXiv PDF

📄 Machine Learning for Medicine Must Be Interpretable, Shareable, Reproducible and Accountable by Design

2025-08-26

Авторы:

Ayyüce Begüm Bektaş, Mithat Gönen

## Контекст Машинное обучение (ML) находит широкое применение в медицине, где данные имеют высокую степень риска и влияния на жизни и здоровье людей. Несмотря на высокую точность, многие модели ML в этой области остаются непонятными для пользователей, что порождает безопасностные, этические и регулировательные затруднения. Необходимость разработки интерпретируемых, доступных для обмена, повторно воспроизводимых и ответственных моделей ML в медицине является решающей задачей для доверия к таким системам и их применения в клинических задачах. ## Метод Авторы предлагают ряд принципов для разработки моделей ML в медицине. Эти принципы включают: 1. **Интерпретируемость (Interpretability):** Использование моделей, позволяющих легко понять, какие факторы вкладываются в принятие решений. Особо упор делается на интерпретируемые модели, такие как ядерные методы с элементами сжатия (sparse kernel methods) и методы типа прототипов (prototype-based learning). 2. **Доступность для обмена (Shareability):** Инфраструктура, позволяющая экспертам делиться моделями и данными, даже если они находятся в разных местах. Особое внимание уделяется подходам, таким как **federated learning**, который обеспечивает общий доступ к данным, не раскрывая их частные аспекты. 3. **Повторная воспроизводимость (Reproducibility):** Надёжность результатов должна подтверждаться через репликацию исследований и экспериментов. Авторы подчёркивают необходимость строгого контроля качества в разработке моделей. 4. **Ответственность (Accountability):** Модели должны быть способны оценивать свою надежность, учитывать неопределенность в данных и стремиться к справедливости в результатах. ## Результаты Авторы проводят обзор различных методов ML, которые удовлетворяют вышеупомянных принципов. Они демонстрируют, что модели, основанные на ядерных методах и прототипной архитектуре, могут показаться менее точными по сравнению с глубокими нейросетями, но они предлагают значительно более высокий уровень интерпретируемости и понятности. Результаты сравнения показывают, что новые подходы могут быть более эффективны в обеспечении доверия и регулируемости в ситуациях, где это критично. ## Значимость Методика, описанная в статье, имеет широкие приложения в медицинских приложениях. Она может использоваться для: - **Консультативных систем:** Модели ML могут дополнить клинические решения, обеспечивая легкое понимание рекомендаций. - **Клиническое применение:** Интерпретируемые модели могут помочь в улучшении оценки риска и диагностике заболеваний. - **Поиск лекарств:** Надёжность и справедливость моделей важна для выявления но

Annotation:

This paper claims that machine learning models deployed in high stakes domains such as medicine must be interpretable, shareable, reproducible and accountable. We argue that these principles should form the foundational design criteria for machine learning algorithms dealing with critical medical data, including survival analysis and risk prediction tasks. Black box models, while often highly accurate, struggle to gain trust and regulatory approval in health care due to a lack of transparency. W...

ID: 2508.16097v1 cs.LG, stat.ML

arXiv PDF

1
2
32
33
34
35
36
38
39

Показано 331 - 340 из 385 записей