📚 Саммари научных статей из arXiv

Найдено 385 результатов по запросу 'cs.LG, stat.ML' Сбросить поиск

📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня

📄 Generative AI models enable efficient and physically consistent sea-ice simulations

2025-08-25

Авторы:

Tobias Sebastian Finn, Marc Bocquet, Pierre Rampal, Charlotte Durand, Flavia Porro, Alban Farchi, Alberto Carrassi

## Контекст Образование и развитие морского льда являются сложными, многомерными процессами, которые определяются множеством факторов, включая атмосферные условия, морские потоки, осадки и климатические изменения. Настоящие модели, используемые для исследования морского льда, часто требуют высоких вычислительных мощностей, что ограничивает их применение в климатических прогнозах и динамике морского льда. Решение этой проблемы требует разработки более эффективных и физически согласованных моделей. ## Метод Модель GenSIM (Generative Sea Ice Model) является первой в своем роде генеративной AI-моделью, работающей на всей территории Арктики. Она предсказывает ключевые свойства морского льда, включая засуху, толщину и движение, в течение 12-часового промежутка времени. GenSIM обучена на данных, полученных из современной модели морского льда, и может эффективно предсказывать множество свойств с ошибками, меньшими чем у детерминированных моделей. Модель также может предсказывать динамику морского льда на долгосрочной основе, в том числе учета тренда уменьшения морского льда за последние десятилетия. ## Результаты Генеративная модель GenSIM показала высокую точность в предсказании ключевых свойств морского льда на короткие и долгосрочные промежутки времени. Она была проверена на данных с высокого разрешения, полученных из современных моделей морского льда, и показала значительную выгоду в точности над детерминированными моделями. Благодаря своей генеративной структуре, модель может эффективно интерпретировать данные и строить прогнозы в режиме реального времени. Это делает её востребованой в климатических прогнозах и в динамике морского льда. ## Значимость Разработанная модель имеет широкие применения в климатических исследованиях, мониторинге и прогнозировании динамики морского льда. Она эффективно оптимизирует вычислительные затраты и позволяет значительно увеличить точность моделей. Благодаря своему уникальному подходу, модель может быть применена для моделирования динамики морского льда в разных климатических условиях, включая нестабильные и неизвестные среды. ## Выводы GenSIM является первым примером использования генеративных AI-моделей для моделирования морского льда в Арктике. Её высокая точность и эффективность позволяют установить новые стандарты в климатических исследованиях. В будущем, модель может быть расширена для моделирования других физических процессов в атмосфере и океане, что даст новые возможности для исследования климата.

Annotation:

Sea ice is governed by highly complex, scale-invariant, and anisotropic processes that are challenging to represent in Earth system models. While advanced numerical models have improved our understanding of the sea-ice dynamics, their computational costs often limit their application in ensemble forecasting and climate simulations. Here, we introduce GenSIM, the first generative AI-based pan-Arctic model that predicts the evolution of all relevant key properties, including concentration, thickne...

ID: 2508.14984v1 physics.ao-ph, cs.LG, stat.ML, 86A05, J.2; I.2.10

arXiv PDF

📄 Transforming Causality: Transformer-Based Temporal Causal Discovery with Prior Knowledge Integration

2025-08-25

Авторы:

Jihua Huang, Yi Yao, Ajay Divakaran

## Контекст Исследование причинно-следственных связей во временных рядах является ключевым заданием в различных областях, таких как медицина, финансы и инженерия. Однако существуют две главные проблемы: сложные нелинейные зависимости и спуриовые корреляции, которые сделали традиционные методы менее эффективными. Необходимо разработать метод, который может обнаруживать причинные связи в нетривиальных ситуациях, с учетом нетопологических связей и многоуровневых зависимостей. Наша мотивация заключается в создании метода, который бы стал более точным и устойчивым в распознавании причинных связей в различных практических задачах. ## Метод Мы предлагаем использовать Transformer-based time-series forecaster, который может обнаруживать нелинейные зависимости во временных рядах. Форекастер имеет несколько слоёв, что позволяет ему построить глубокий анализ зависимостей в данных. Чтобы определить причинные связи и временные задержки, мы используем градиентный анализ на выходных данных модели. Также, мы внедрили механизм подключения предварительных знаний, основывающийся на маскировании внимания (attention masking). Этот механизм позволяет постоянно исключать нежелательные причинные связи на разных уровнях модели, что улучшает её устойчивость и точность. ## Результаты Мы проверили нашу модель на нескольких стандартных наборах данных, включая Google Stock Price и MSR Body Sensor Data. Мы сравнивали нашу модель с другими современными методами, такими как NOTEARS и GCL. Наши результаты показали, что Transformer-based forecaster показал 12.8% выигрыш в F1-меру по сравнению с другими методами, а точность оценки временных задержек достигла 98.9%. Эти результаты подчеркивают эффективность нашего подхода в задачах обнаружения причинных связей. ## Значимость Мы предлагаем новый подход к обнаружению причинных связей в временных рядах, который может быть применен в таких областях, как медицинское мониторинго, финансовый анализ и прогнозирование биологических процессов. Наш метод показал себя как более точный и устойчивый по сравнению с другими существующими. Из-за того, что он использует Transformer-based архитектуру и механизмы подключения предварительных знаний, он может быть применён в сложных ситуациях, где другие модели могут представлять собой проблемы. ## Выводы Мы представили новую модель для обнаружения причинных связей во временных рядах, использующую Transformer-based forecaster и механизмы маскирования внимания. Мы продемонстрировали, что наш подход значительно улучшает точность и устойчивость в задачах обнаружения причинных связей. Наше исследование открывает новые пути для будущих исследований в этой области, вкл

Annotation:

We introduce a novel framework for temporal causal discovery and inference that addresses two key challenges: complex nonlinear dependencies and spurious correlations. Our approach employs a multi-layer Transformer-based time-series forecaster to capture long-range, nonlinear temporal relationships among variables. After training, we extract the underlying causal structure and associated time lags from the forecaster using gradient-based analysis, enabling the construction of a causal graph. To ...

ID: 2508.15928v1 cs.LG, stat.ML

arXiv PDF

📄 Tensorized Multi-Task Learning for Personalized Modeling of Heterogeneous Individuals with High-Dimensional Data

2025-08-23

Авторы:

Elif Konyar, Mostafa Reisi Gahrooei, Kamran Paynabar

#### Контекст Построение эффективных моделей для характеризации и предсказания поведения индивидуальных субпапуляций возникает во многих областях, включая медицину, маркетинг, безопасность и анализ трафика. Однако существуют серьезные трудности, связанные с различиями в индивидуальных характеристиках и поведенческих моделях. Это может привести к пониженной точности моделей и трудностям в их интерпретации. Для решения этой проблемы требуется метод, который мог бы учитывать общие черты и различия между субпапуляциями. Наша мотивация заключается в развитии метода, который бы позволял эффективно учитывать общие шаблоны и индивидуальные особенности в моделировании субпапуляций. #### Метод Мы предлагаем развитие фреймворка, основанного на многозадачном обучении (MTL) и низкоранговой декомпозиции тензоров. Моделирование многозадачности позволяет идентифицировать общие шаблоны между задачами, в то время как низкоранговая декомпозиция удаляет излишние параметры, упрощая интерпретацию модели. Архитектура MTL разделяет модель на две части: общую структуру, которая присутствует во всех задачах, и задачи-специфичные параметры, отвечающие за уникальные особенности каждой задачи. Мы также внедрили низкоранговую декомпозицию, которая позволяет хранить общие шаблоны в низкоранговой структуре и индивидуальные характеристики в низкоранговой структуре. Это подход допускает эффективное обучение моделей, делится знаниями для повышения точности и обеспечивает интерпретируемость модели. #### Результаты Мы провели эксперименты на симуляционных данных и реальных случаях, чтобы проверить эффективность нашего подхода. Для обучения использовались высокоразмерные данные, представляющие собой многозадачное обучение, с разными субпапуляциями. Мы сравнили наш подход с несколькими бенчмарками, включая методы многозадачного обучения и низкоранговой декомпозиции. Результаты показали, что наш метод превосходит бенчмарки по точности предсказания и интерпретируемости модели, особенно в случаях высокой разности между субпапуляциями. Это демонстрирует эффективность нашего подхода в моделировании сложных субпапуляций. #### Значимость Наш подход может применяться в различных областях, таких как здравоохранение, финансы, маркетинг и транспортная система. Он предлагает несколько преимуществ, таких как улучшение точности предсказания, уменьшение потребления ресурсов вычислений и улучшение интерпретируемости. Эти преимущества делают наш фреймворк привлекательным для решения проблем мо

Annotation:

Effective modeling of heterogeneous subpopulations presents a significant challenge due to variations in individual characteristics and behaviors. This paper proposes a novel approach to address this issue through multi-task learning (MTL) and low-rank tensor decomposition techniques. Our MTL approach aims to enhance personalized modeling by leveraging shared structures among similar tasks while accounting for distinct subpopulation-specific variations. We introduce a framework where low-rank de...

ID: 2508.15676v1 cs.LG, stat.ML

arXiv PDF

📄 Label Uncertainty for Ultrasound Segmentation

2025-08-23

Авторы:

Malini Shivaram, Gautam Rajendrakumar Gare, Laura Hutchins, Jacob Duplantis, Thomas Deiss, Thales Nogueira Gomes, Thong Tran, Keyur H. Patel, Thomas H Fox, Amita Krishnan, Deva Ramanan, Bennett DeBoisblanc, Ricardo Rodriguez, John Galeotti

## Контекст Медицинская имагинг стал важной частью диагностики и лечения многих заболеваний. Одна из самых распространенных задач в этой области — сегментация областей интереса на имажах, таких как легочные ультразвуковые сканы (LUS). Однако существуют серьезные вызовы, связанные с тем, что эти задачи часто требуют интерпретации интервьювером, что приводит к несогласованности в аннотации данных. Например, в LUS часто встречаются области с значительной неоднозначностью, что делает задачу аннотации сложной даже для опытных клиников. Эта неоднозначность приводит к проблеме **label uncertainty**, которая влияет на качество обучения и моделирования AI. Мы предлагаем новый подход, который использует **per-pixel confidence values**, представленные экспертами во время аннотации, для точной моделирования этой неопределенности и улучшения сегментационных моделей. ## Метод Мы предлагаем **novel annotation protocol**, в котором клиники указывают не только лейблы, но и **confidence values** для каждого пикселя. Эти значения представляют собой уверенность клиников в том, что пиксель принадлежит той или иной категории. Мы используем эти показатели в тренировочном процессе AI-моделей вместо обычных лейблов. Наше решение включает в себя **training pipeline**, где алгоритмы обучаются на сгенерированных лейблах с учетом уверенности клиников. Мы также изучаем различные **thresholding approaches** для работы с этими лейблами, что позволяет контролировать точность во время обучения. Этот подход позволяет не только улучшить сегментацию, но и демонстрировать значительные положительные результаты на задачах клинического применения. ## Результаты Мы провели эксперименты на данных LUS, используя различные подходы к обработке уверенности в аннотациях. Наши результаты показывают, что **high confidence thresholds** (например, 60%) дают значительно лучшие результаты по сравнению с низкими порогами (например, 50%). Мы также демонстрируем, что модели, обученные на этих уверенных пикселях, не только показывают лучшую сегментацию, но и позволяют предсказать клинически важные параметры: **S/F oxygenation ratio**, классификацию изменений в S/F ratio и предсказание 30-дневного перепоступления пациентов в больницу. Эти результаты подтверждают, что **confidence-aware training** не только улучшает качество сегментации, но и позволяет моделям выполнять критичные задачи в медицинской практике. ## Значимость Наш подход может быть применен в различных областях медицинской имагинга, где неоднозначность в аннотации является общей проблемой. Это включает LUS, которая часто используется для оценки респираторных заболеваний. Особый потенциал виден в улучшении **downstream clinical tasks**, таких как оценка индекса S/F и прогнозирова

Annotation:

In medical imaging, inter-observer variability among radiologists often introduces label uncertainty, particularly in modalities where visual interpretation is subjective. Lung ultrasound (LUS) is a prime example-it frequently presents a mixture of highly ambiguous regions and clearly discernible structures, making consistent annotation challenging even for experienced clinicians. In this work, we introduce a novel approach to both labeling and training AI models using expert-supplied, per-pixel...

ID: 2508.15635v1 eess.IV, cs.AI, cs.CV, cs.LG, stat.ML

arXiv PDF

📄 Noise Robust One-Class Intrusion Detection on Dynamic Graphs

2025-08-22

Авторы:

Aleksei Liuliakov, Alexander Schulz, Luca Hermes, Barbara Hammer

## Контекст Сетевая атака представляет собой нежелательные действия, направленные на подрыв или украдкой информации. Наблюдение за ними требует систем, которые могут работать в условиях влияния шума и помех на данные. Такие системы должны гарантировать высокую точность в динамических сетях, где структура и поведение узлов могут меняться с течением времени. Известные подходы, такие как графные темпоральные сети (TGN), не всегда эффективны при обработке шума или в интересах обеспечения высокой точности в динамических сетях. Таким образом, необходимо новые методы, обеспечивающие уверенность в высокой точности даже при высоких уровнях шума в данных. ## Метод Мы предлагаем модель Temporal Graph Network Support Vector Data Description (TGN-SVDD) с проблематичной линейностью, которая использует пространство функций Римана для моделирования сетевого трафика. Модель определяет нормальное поведение сети, основываясь на данных, которые были собраны в реальном времени. Одним из ключевых аспектов этой модели является использование априорной информации о распределении данных, что позволяет улучшить точность моделирования шума. Мы также реализовали метод градиентного бустинга для обучения модели, чтобы оптимизировать ее во время обучения. ## Результаты Мы проводили эксперименты на зараженном датасете CIC-IDS2017, добавив синтетический шум различных уровней. Наша модель показала значительно лучшую точность, чем базовая модель TGN-SVDD. Особое внимание уделялось повышению точности в ситуациях, когда шум добавлялся в данные. Мы также проверили, насколько модель устойчива к разным типам помех, включая сильный шум, что подтвердило ее высокую обобщающую способность. ## Значимость Наш подход может быть применен в различных сферах, включая сетевые атаки, безопасность информации и мониторинг сетевого трафика. Он может применяться в системах, которые нуждаются в высокой точности даже в условиях высокого шума в данных. Это может позволить улучшить качество систем мониторинга и защиты от атак, что в свою очередь способствует более безопасному идеальному использованию Интернета. ## Выводы Мы привносили новую модель, которая позволяет сделать сетевую систему более устойчивой к шуму и помехам. Наши эксперименты показали, что она превосходит базовую модель в несколько показателей, в том числе в ситуации с высоким уровнем шума. Наши результаты подтверждают то, что модель может быть применима в различных ситуациях, где необходимо обеспечить высокую точность моделирования в условиях шума. Будущие исследования буду

Annotation:

In the domain of network intrusion detection, robustness against contaminated and noisy data inputs remains a critical challenge. This study introduces a probabilistic version of the Temporal Graph Network Support Vector Data Description (TGN-SVDD) model, designed to enhance detection accuracy in the presence of input noise. By predicting parameters of a Gaussian distribution for each network event, our model is able to naturally address noisy adversarials and improve robustness compared to a ba...

ID: 2508.14192v1 cs.LG, stat.ML

arXiv PDF

📄 A Non-Asymptotic Convergent Analysis for Scored-Based Graph Generative Model via a System of Stochastic Differential Equations

2025-08-22

Авторы:

Junwei Su, Chuan Wu

## Контекст Score-based graph generative models (SGGMs) являются мощными инструментами в области генетического моделирования, применяющиеся в таких критически важных задачах, как синтез белков и открытие лекарств. Их уникальность заключается в том, что они используют систему коррелированных стохастических дифференциальных уравнений (SDE) для генерирования графов, включая их структуру и характеристики вершин. Это отличает SGGMs от однородных score-based generative models (SGMs), которые используют только одно SDE. Теоретическое поведение SGGMs, в том числе их сходимость, до сих пор мало исследовано. Это недостаточное понимание ограничивает их развитие и применение в реальных ситуациях. Таким образом, целью данного исследования является установление неасимптотического анализа сходимости SGGMs и выявление факторов, влияющих на неё. ## Метод Для достижения поставленных целей, авторы применяют метод анализа системы связанных стохастических дифференциальных уравнений, которые управляют развитием графа и его узлов. Методология основывается на разработке новой теории конвергенции, которая учитывает особенности SGGMs, такие как взаимосвязь между структурой графа и его характеристиками. Для проведения экспериментов использованы синтетические графы, позволяющие управлять параметрами и мерять поведение модели. Целью является получение четких теоретических оценок сходимости и определение гиперпараметров, оптимизирующих процесс генерации графов. ## Результаты В ходе исследования было получено новое неасимптотическое описание сходимости SGGMs для трёх ключевых сценариев: (1) генерации характеристик с фиксированной структурой графа, (2) генерации структуры графа с фиксированными характеристиками узлов и (3) совместной генерации структуры и характеристик. Авторы выявили, что факторы, такие как топологические свойства графа и размерность узлов, влияют на сходимость. Также были выявлены оптимальные значения гиперпараметров, таких как длина диффузии и шаг выборки, которые способствуют улучшению качества генерации. Эмпирические эксперименты подтвердили теоретические предложения, демонстрируя надежные результаты в различных сценариях. ## Значимость Результаты этого исследования вносят значительный вклад в теоретическое понимание SGGMs и их применение в критически важных областях, таких как синтез лекарств и моделирование биологических процессов. Теоретические результаты дают гид для выбора параметров и оптимизации моделей. Также это открытие может положительно сказаться на развитии

Annotation:

Score-based graph generative models (SGGMs) have proven effective in critical applications such as drug discovery and protein synthesis. However, their theoretical behavior, particularly regarding convergence, remains underexplored. Unlike common score-based generative models (SGMs), which are governed by a single stochastic differential equation (SDE), SGGMs involve a system of coupled SDEs. In SGGMs, the graph structure and node features are governed by separate but interdependent SDEs. This d...

ID: 2508.14351v1 cs.LG, stat.ML

arXiv PDF

📄 Measuring IIA Violations in Similarity Choices with Bayesian Models

2025-08-22

Авторы:

Hugo Sales Corrêa, Suryanarayana Sankagiri, Daniel Ratton Figueiredo, Matthias Grossglauser

## Контекст Многие модели классической метрической теории выбора основываются на принципе независимости неинтересных альтернатив (IIA, Independence of Irrelevant Alternatives). Этот принцип упрощает формализацию, но часто нарушается в реальных ситуациях. Хотя нарушения IIA широко изучаются в области дискретного выбора, в рамках моделей выбора, основанных на сходстве (similarity choice), они получили меньше внимания. Это объясняется тем, что целесообразность сходства зависит от контекста выбора, что усложняет тестирование на наличие нарушений IIA. В нашей работе мы предлагаем новые статистические методы для тестирования IIA в моделях выбора на основе сходства. ## Метод Мы разработали два метода для тестирования IIA. Первый — классический критерий гуднесс-оф-фит (GoF), который определяет наличие нарушений IIA с помощью хи-квадрат-теста. Второй — метод на основе постериорных прогностических контролей (Posterior Predictive Checks, PPC), который заключается в сравнении реальных данных с модельными ожиданиями. Этот второй метод является основным техническим вкладом нашей работы, так как он не только тестирует наличие нарушений IIA, но и оценивает их степень. Мы также разработали новый PPC-тест для оценки гомогенности популяции, который позволяет проверить, влияют ли на нарушения IIA факторы, связанные с контекстом выбора. ## Результаты Мы проверили наши методы на двух датасетах. Первый датасет был специально сконструирован для выявления нарушений IIA, а второй был сгенерирован случайным образом из одного объема элементов. Оба метода показали значительные нарушения IIA на обоих датасетах, что указывает на схожую степень нарушений в межличностном и внутриличностном выборе. Более того, наши результаты показали, что в каждый момент времени в выборах возникают контекстные эффекты, которые влияют на IIA. Новый PPC-тест подтвердил, что выборщики в основном одинаковы, что означает, что нарушения IIA возникают в результате контекстных эффектов, а не из-за различий в поведении индивидуумов. ## Значимость Наши результаты имеют важное значение для области моделей выбора на основе сходства. Они подтверждают, что нарушения IIA возникают не только в рамках дискретного выбора, но и в моделях выбора на основе сходства. Это открывает путь к разработке моделей, которые будут учитывать контекстные эффекты. Наши методы могут быть применены для тестирования выборов в различных сферах, включая информационную поисковую систему и обучение в стиле embeddings. Эти методы также могут помочь в понимании и моделировании контекстных эффектов в выборах. ## Выводы Мы успешно разработали новые статистические методы для тестирования нарушений IIA в моделях выбо

Annotation:

Similarity choice data occur when humans make choices among alternatives based on their similarity to a target, e.g., in the context of information retrieval and in embedding learning settings. Classical metric-based models of similarity choice assume independence of irrelevant alternatives (IIA), a property that allows for a simpler formulation. While IIA violations have been detected in many discrete choice settings, the similarity choice setting has received scant attention. This is because t...

ID: 2508.14615v1 cs.LG, stat.ML, I.2.6

arXiv PDF

📄 Disentangled Deep Smoothed Bootstrap for Fair Imbalanced Regression

2025-08-21

Авторы:

Samuel Stocksieker, Denys pommeret, Arthur Charpentier

## Контекст Исследование решения проблемы неравномерного распределения данных в подсистемах системы безопасности является важной задачей в области машинного обучения. Неравномерность данных в обучающем корпусе может привести к снижению качества моделей машинного обучения, особенно в задачах регрессии. В статье предлагается новый подход для улучшения обучения с использованием табулярных данных в контексте неравномерного регрессионного рамфамвока (Imbalanced Regression, IR). Обработка неравномерных данных в регрессии широко распространена в практических задачах, например, в предсказании финансовых показателей, прогнозировании клиентских поведенческих моделей и др. Данный метод значительно улучшает результаты стандартных методов обработки неравномерного распределения в регрессионных задачах. ## Метод Метод, предложенный авторами, основывается на применении Variational Autoencoders (VAEs) для моделирования и определения латентного представления данных. Однако стандартные VAEs могут быть неэффективными при обучении на неравномерных данных. Для решения этой проблемы разработана инновационная техника, которая сочетает в себе disentangled VAE с методом Smoothed Bootstrap, примененным в латентном пространстве. Это позволяет лучше учитывать неравномерность данных и повысить точность модели. Кроме того, предлагается систематический подход к оценке эффективности метода с использованием множества бенчмарк-данных, что позволяет сравнить его с другими подходами в задачах IR. ## Результаты Эксперименты проводились на нескольких выборках данных из реальной практики, которые характеризуются неравномерным распределением. Метод показал значительное улучшение результатов по сравнению с остальными методами, особенно в ситуациях, когда данные имеют высокий уровень неравномерности. Измеренные показатели, такие как RMSE и MAE, показали значительное снижение ошибки в предсказаниях. Эти результаты подтверждают эффективность предлагаемого подхода в задачах регрессии с неравномерным распределением данных. ## Значимость Предлагаемый подход может быть использован в различных областях, где неравномерные данные являются типичной проблемой, например, в финансовых прогнозах, здравоохранении, прогнозировании поведенческих моделей. Основные преимущества метода заключаются в том, что он не только улучшает точность регрессионных моделей на неравномерных данных, но и обеспечивает более стабильный интерпретируемый результат. Это может иметь потенциал для широкого применения в практических задачах и может способствовать развитию новых методов обработки данных в регрессионных задачах. ## Выводы Результаты исследования показывают, что предложенный подход эффекти

Annotation:

Imbalanced distribution learning is a common and significant challenge in predictive modeling, often reducing the performance of standard algorithms. Although various approaches address this issue, most are tailored to classification problems, with a limited focus on regression. This paper introduces a novel method to improve learning on tabular data within the Imbalanced Regression (IR) framework, which is a critical problem. We propose using Variational Autoencoders (VAEs) to model and define ...

ID: 2508.13829v1 cs.LG, stat.ML

arXiv PDF

📄 Constrained Centroid Clustering: A Novel Approach for Compact and Structured Partitioning

2025-08-20

Авторы:

Sowmini Devi Veeramachaneni, Ramamurthy Garimella

#### Контекст Классические методы кластеризации, такие как K-means и Gaussian Mixture Models (GMM), становятся неэффективными при работе с данными, требующими компактной и структурированной партиционировании. Эти методы не учитывают ограничения на распределение точек в кластерах, что приводит к выведению подробных доказательств или нежелательным распределению. В этом контексте возникает необходимость разработки методов, которые могут обеспечить компактность кластеров с приращением распределения точек внутри них. Целью данной работы является разработка такого метода, который бы стал стандартом в ситуациях, где необходима компактность кластеров с учетом распределения точек внутри них. #### Метод Предлагаемый Constrained Centroid Clustering (CCC) расширяет классические методы кластеризации, внеся ограничение на максимальное расстояние от центра кластера до самой удаленной точки. Данное ограничение внедряется с помощью Lagrangian-формулировки, что позволяет достичь закрытого решения с максимальной интерпретируемостью. Таким образом, CCC позволяет контролировать распространение кластеров, улучшая их компактность без потери структуры. Данная модель имеет значительные преимущества по сравнению с существующими методами, так как она обеспечивает более точное разделение данных, сохраняя их структуру. #### Результаты Проведенные эксперименты показали, что CCC эффективно выполняет задачи компактной кластеризации, особенно при работе с радиально симметричными данными, такими как данные с радиальным распределением и угловой симметрией. Эти эксперименты были проведены с использованием различных метрик: радиального распределения, секторального распределения и совокупной энтропии. На основе этих результатов было установлено, что CCC представляет собой более эффективный подход к кластеризации, чем методы, такие как K-means и GMM. Это обусловлено тем, что CCC обеспечивает более компактные кластеры, сохраняя распределение точек внутри них, что недостижимо при использовании исходных методов. #### Значимость Предлагаемый подход имеет широкое применение в ситуациях, где необходимо обеспечить компактность кластеров с учетом распределения точек внутри них. Например, CCC может быть применен в системах сенсорных сетей, коллаборативных роботах и анализе интерпретируемого паттерна. Основные преимущества CCC заключаются в том, что он обеспечивает более точное разделение данных и позволяет контролировать распределение точек внутри кластеров, что недостижимо при использовании классических методов. Это может иметь значительное влияние на развитие технологий, где необходимо надежное раз

Annotation:

This paper presents Constrained Centroid Clustering (CCC), a method that extends classical centroid-based clustering by enforcing a constraint on the maximum distance between the cluster center and the farthest point in the cluster. Using a Lagrangian formulation, we derive a closed-form solution that maintains interpretability while controlling cluster spread. To evaluate CCC, we conduct experiments on synthetic circular data with radial symmetry and uniform angular distribution. Using ring-wis...

ID: 2508.12758v1 cs.LG, stat.ML

arXiv PDF

📄 Fairness-Aware Multi-view Evidential Learning with Adaptive Prior

2025-08-20

Авторы:

Haishun Chen, Cai Xu, Jinlong Yu, Yilin Zhang, Ziyu Guan, Wei Zhao

## Контекст Много birds-eye view с EVIDENTIAL learning (МВЕЛ) является важной областью исследований в машинном обучении, сосредоточенной на интеграции информации из различных представлений данных для улучшения точности предсказаний и доверительной оценки неопределенности. Однако, существующие подходы часто признают, что обучение специфических для представления способа беспрекословно надежно и сбалансировано. На практике, это часто не так. Неравномерное присвоение доказательств данным классам приводит к недостоверной оценке неопределенности и, в настоящее время, к неудовлетворительному выполнению предсказаний. Это побудило авторов изучить новую проблему Biased Evidential Multi-view Learning (БЕМЛ), нацеленную на устранение этих недостатков. ## Метод Предлагаемый подход, Fairness-Aware Multi-view Evidential Learning (FAML), разрабатывает систему управления убеждениями, которая активно корректирует несбалансированное присвоение доказательств. Ключевым элементом является адаптивный признак, основанный на траектории обучения, который действует как регуляризатор для устранения биаса. Добавленный классный контроль равенства позволяет обеспечить более равномерное присвоение доказательств в классах. На этапе слияния представлений, алгоритм FAML использует механизм согласования мнений для устранения взвешивания представлений и повышения согласованности и поддержки между ними. ## Результаты Исследования проводились на пяти реальных много birds-eye view датасетах. Эксперименты показали, что FAML значительно снижает недостоверность неопределенности и обеспечивает более сбалансированное присвоение доказательств. Это приводит к улучшению точности предсказаний и восприятия некоторых классов, по сравнению с состояниями текущего штата. Эти результаты доказывают эффективность FAML в адресации проблемы биаса в много birds-eye view с EVIDENTIAL learning. ## Значимость Проposed система может применяться в области решения задач, где достоверная оценка неопределенности критична, таких как медицинская диагностика, финансовый мониторинг и классификация текстов. Этот подход предоставляет более надежные предсказания и повышает доверие к модели. Его потенциал заключается в улучшении широкого круга приложений, где более точное и справедливое обучение ключево. ## Выводы Работа FAML устанавливает новый подход к решению проблемы биаса в много birds-eye view с EVIDENTIAL learning. Она обеспечивает более сбалансированное присвоение доказательств, повышает доверительные оценки неопределенности и повышает точность предсказаний. Будущие исследования будут сосредоточены на расширении этого подхода к более сложным сценариям и реализации его в практических задачах.

Annotation:

Multi-view evidential learning aims to integrate information from multiple views to improve prediction performance and provide trustworthy uncertainty esitimation. Most previous methods assume that view-specific evidence learning is naturally reliable. However, in practice, the evidence learning process tends to be biased. Through empirical analysis on real-world data, we reveal that samples tend to be assigned more evidence to support data-rich classes, thereby leading to unreliable uncertainty...

ID: 2508.12997v1 cs.LG, stat.ML

arXiv PDF

1
2
33
34
35
36
37
38
39

Показано 341 - 350 из 385 записей