📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 0

Последнее обновление: сегодня
Авторы:

Byungchang So

## Контекст Магнитуда (magnitude), которая является особым случаем эвклидового характеристического числа, представляет собой меру размера метрических пространств и связана с классическими понятиями, такими как число элементов, размерность и объем. Ранее проводились исследования, основывающиеся на различных перспективах, чтобы объяснить смысл магнитуды. Однако недавние работы показали, что видение магнитуды через призму непрерывности также может быть полезно. В этой статье автор фокусируется на непрерывности весового распределения (weighting), которое является целостным значением магнитуды, и на его изменении в соответствии с максимальной разнообразностью (maximum diversity). Данный подход приложен к анализу временных рядов, где вводится новый тип инвариантов периодических временных рядов. Кроме того, проводится эксперимент машинного обучения с реальными данными, в котором использование этих инвариантов улучшает результаты. ## Метод В работе применено развитие теории магнитуды, которая основывается на многообразиях и их модификациях. Автор использует методы контрольа и сравнения, чтобы доказать непрерывность весового распределения и его изменения в зависимости от максимальной разнообразности. Архитектура приложения включает в себя алгоритмы вычисления весовых распределений и инвариантов для временных рядов. Технические решения включают использование методов категориальных многообразий, в частности, обобщения теории магнитуды на более широкий класс пространств. Эти методы применяются к временным рядам, которые представлены в виде множеств точек в метрическом пространстве. ## Результаты В ходе проведения экспериментов показано, что инварианты временных рядов, основанные на весовых распределениях, улучшают точность моделей машинного обучения. Данные для экспериментов были получены из реальных источников, таких как данные сенсоров и экономические показатели. На основе этих результатов доказано, что введенные инварианты позволяют улучшать предсказательную силу моделей, особенно при работе с периодичными временными рядами. Также были получены результаты, подтверждающие непрерывность весового распределения и его зависимость от максимальной разнообразности. ## Значимость Предложенные инварианты могут быть полезны в различных областях, включая информатику, физику и биологию. Особенно они применимы в области анализа временных рядов, где необходимо учитывать периодичность и структуру данных. Эти инварианты могут быть использованы для улучшения методов классификации, регрессии и других задач машинного обучения. Благодаря непрерывности весово
Annotation:
Magnitude, obtained as a special case of Euler characteristic of enriched category, represents a sense of the size of metric spaces and is related to classical notions such as cardinality, dimension, and volume. While the studies have explained the meaning of magnitude from various perspectives, continuity also gives a valuable view of magnitude. Based on established results about continuity of magnitude and maximum diversity, this article focuses on continuity of weighting, a distribution whose...
ID: 2509.11146v1 stat.ML, cs.LG, eess.SP, math.MG, 46N40, 51F99, 68T10
Авторы:

Leon Chlon, Ahmed Karim, Maggie Chlon

## Контекст Large language models (LLMs) — это мощные инструменты для обработки и генерации текста, основывающиеся на трансформерах. Они могут решать задачи в области естественного языка, включая автоматический перевод, синтез и анализ текста. Несмотря на их выдающиеся достижения, LLMs часто "халлуцинируют" — генерируют информацию, несовместимую с данными ввода. Это проявляется в неточности, несоответствии фактам и ложному понимании задач. Такое поведение связано с особенностями их архитектуры и методологии обучения. Эти проблемы ограничивают доверие к LLMs в критически важных приложениях, таких как медицинские диагностика и финансовый анализ. Наша исследовательская мотивация состоит в том, чтобы изучить причины такого поведения и разработать методы, позволяющие предсказуемо устранять такие "халлуцинации". ## Метод Мы разрабатываем метод, основанный на теории информации и компьютерных моделях, для анализа и устранения "халлуцинаций" в LLMs. Наш подход заключается в том, чтобы измерить и контролировать неоднородность в выводе модели, используя понимание генерации текста как процесса сжатия информации. Мы используем следующие технические решения: 1. **Оптимизация компрессии при оценке текста**: Мы рассматриваем контроль размера данных, генерируемых моделью, как ключевую компоненту. 2. **Повышение степени понимания модели**: Мы вводим механизмы, которые позволяют модели лучше понимать контекст и отделять достоверные данные от ложных. 3. **Адаптивность модели**: Мы разрабатываем алгоритмы, которые позволяют модели адаптироваться к новым типам данных и ситуациям. ## Результаты Мы проводим эксперименты на нескольких наборах данных, включая текстовые корпуса в различных языках и вариантах задач (например, синтез текста и вывод ответов на вопросы). Мы удачно проверяем наши теоретические модели на практике, получая результаты, показывающие снижение частоты "халлуцинаций". Мы также показываем, что наш подход позволяет улучшить точность решений и снизить неточности в выводе модели. ## Значимость Результаты нашего исследования имеют огромное значение для развития технологий генерации текста. Мы показываем, что наш подход может быть применен в следующих областях: 1. **Синтез текста**: Мы улучшаем качество сгенерированного текста, устраняя "халлуцинации". 2. **Диагностика**: Мы снижаем риск ошибок в системах, основанных на LLMs, для критически важных приложений. 3. **Финансовый анализ**: Мы повышаем достоверность моделей при анализе и генерации текстов в финансовых приложениях. Преимущест
Annotation:
Large language models perform near-Bayesian inference yet violate permutation invariance on exchangeable data. We resolve this by showing transformers minimize expected conditional description length (cross-entropy) over orderings, $\mathbb{E}_\pi[\ell(Y \mid \Gamma_\pi(X))]$, which admits a Kolmogorov-complexity interpretation up to additive constants, rather than the permutation-invariant description length $\ell(Y \mid X)$. This makes them Bayesian in expectation, not in realization. We deriv...
ID: 2509.11208v1 stat.ML, cs.LG
Авторы:

Zihan Dong, Xin Zhou, Ryumei Nakada, Lexin Li, Linjun Zhang

## Контекст Сетевая представительственственность — это подход к преобразованию сложности сетевых структур в низкомерическое пространство, сохраняя структурные и семантические свойства. Этот подход находит применение в различных областях, включая обнаружение социальных сетей, анализ биологических сетей и прогнозирование социальных характеристик. Однако в некоторых задачах, например в анализе брайн-коннективности, встречаются специфические сетевые структуры: тематические, высокомерические и спарсные, которые часто не содержат дополнительных меток по узлам или ребрам. Эти особенности становятся проблемами для традиционных методов. Мы призваны развить методы, которые могут эффективно кодировать ребра сетей в таких сложных сетевых структурах. ## Метод Мы предлагаем подход, названный Adaptive Contrastive Edge Representation Learning (ACERL), который основывается на двух ключевых компонентах: 1) противопоставить сетевым парным контрастирующим выбором и 2) применение данных-зависимого адаптивного маскирования. В ACERL мы используем некоторые автономные методы для генерации расширенных сетевых пар, которые стимулируют способность модели к различным структурам. Адаптивное маскирование позволяет учитывать конкретные особенности каждого сетевого ребра, что улучшает его представление. Мы также устанавливаем теоретические ограничения на ошибки ACERL, что подтверждает его точность и эффективность. ## Результаты Мы проверили ACERL на синтетических данных, а также на данных реальных брайн-коннективностей. Метод показал высокую точность в задачах классификации сетей, выявления важных ребер и обнаружения сообществ. Кроме того, мы проверили, что ACERL демонстрирует лучшую точность по сравнению с традиционным методом, таким как Sparse Principal Component Analysis (SPCA). Эти результаты подтверждают эффективность и универсальность ACERL в различных сетевых задачах. ## Значимость Метод ACERL может быть применен в различных областях, включая анализ биологических сетей, классификацию данных и обнаружение групп. Он преобразовывает сложные высокомеричные сети в низкомерические пространства, что упрощает задачи классификации и обнаружения. Мы также отмечаем, что ACERL значительно улучшает качество прогнозирования и спарсинга в сетях спарсных структур. Это делает его применимым в сложных сетевых анализах, где традиционные методы не дают требуемого качества. ## Выводы Мы представляем новую методику ACERL для кодирования ребер сетей, которая эффективно работает в сложных сетевых структурах. Мы продемонстрировали его эффективность на синтетических данных и реальных сетях брайн
Annotation:
Network representation learning seeks to embed networks into a low-dimensional space while preserving the structural and semantic properties, thereby facilitating downstream tasks such as classification, trait prediction, edge identification, and community detection. Motivated by challenges in brain connectivity data analysis that is characterized by subject-specific, high-dimensional, and sparse networks that lack node or edge covariates, we propose a novel contrastive learning-based statistica...
ID: 2509.11316v1 stat.ML, cs.LG, stat.ME
Авторы:

Rok Cestnik, Erik A. Martens

#### Контекст Современные динамические системы часто описываются временными рядами, которые требуют точного моделирования и интерпретации. Однако многие существующие подходы страдают от ограниченности гибкости, сложности реализации или недостаточной стабильности при работе с частичными и шумными данными. Нейросетевые модели, такие как резервные вычисления (reservoir computing, RC), предлагают эффективное решение для таких задач. Новая архитектура RC, описанная в данной работе, стремится улучшить гибкость и точность моделирования динамических систем, обходя ограничения предыдущих подходов. #### Метод Метод представляет собой новую версию резервных вычислений, основанную на псевдослучайной нелинейной проекции временно задержанного входа. Эта проекция генерирует функционально разнообразный резерв, позволяя выбору различных гиперпараметров для оптимизации. Архитектура резервной сети основывается на слоях признаков, позволяющих гибко определять размерность признакового пространства. Метод был реализован с использованием нейронов с градиентным спуском для обучения, что обеспечивает быструю и стабильную конфигурацию для различных задач. #### Результаты Выполнены эксперименты на нескольких бенчмарк-задачах, включая реконструкцию аттракторов, оценивание диаграмм бифуркаций и интерпретацию фаз асинхронных колебаний. Использовались частичные и шумные данные для тестирования устойчивости и точности модели. Результаты показали, что модель обеспечивает высокую точность и держится на высоком уровне стабильности даже при длительных прогонах. Этот подход эффективно генерирует альтернативные модели динамических систем, которые могут использоваться для суррогатного моделирования и цифровых дигитальных двойников. #### Значимость Новый подход к резервным вычислениям имеет широкие области применения в науке и технологиях. Он может использоваться для моделирования и контроля динамических систем в таких областях, как климатическое моделирование, инженерия и робототехника. Наиболее выгодным является его применение в виртуальных двойниках (digital twins), которые требуют точного моделирования динамических процессов. Этот подход позволяет улучшить точность и скорость моделирования, а также снизить затраты на вычисления. #### Выводы Модель, представленная в этой работе, доказывает свою эффективность в моделировании динамических систем с помощью резервных вычислений. Она предоставляет новые возможности для моделирования, анализа и управления сложными системами. В будущем планируется расширить применение этого подхода к более сложным задачам, а также привнести дополнительные усоверш
Annotation:
We present a simple and scalable implementation of next-generation reservoir computing for modeling dynamical systems from time series data. Our approach uses a pseudorandom nonlinear projection of time-delay embedded input, allowing an arbitrary dimension of the feature space, thus providing a flexible alternative to the polynomial-based projections used in previous next-generation reservoir computing variants. We apply the method to benchmark tasks -- including attractor reconstruction and bif...
ID: 2509.11338v1 stat.ML, cs.LG
Авторы:

Chen Cheng, John Duchi

## Контекст Область исследования связана с методами обработки шума в данных и его воздействие на машинное обучение. Одной из главных проблем является то, что необработанные данные часто содержат шум, который может существенно повлиять на качество моделей и их обобщающие способности. Изучение этой проблемы мотивируется тем, что многие реальные мировые данные являются неточными, содержат ошибки или несогласованности. Это влечет за собой потребность в методах, которые бы позволяли улучшить качество данных до того, как они будут использованы для обучения моделей. Одним из таких методов является "label cleaning", т.е. очистка информации о меток, чтобы уменьшить шум и улучшить согласованность меток. ## Метод Авторы предлагают метод очистки меток, который основывается на агрегировании меток, полученных из нескольких источников или ответов пользователей. Этот процесс включает в себя несколько этапов: 1. **Извлечение меток**: Метоки могут быть получены, например, от оценок пользователей или ответов экспертов. 2. **Агрегирование меток**: Алгоритм агрегирует все полученные метоки, используя статистические методы, такие как медианные или средние значения, для выделения наиболее верных меток. 3. **Очистка меток**: Те метоки, которые не согласовываются с агрегированным видом, отбрасываются. 4. **Использование очищенных меток**: Очищенные метоки используются вместо исходных при обучении модели. В этой модели используется также подход к минимизации суррогатной функции потерь, что позволяет улучшать стабильность и точность модели. Авторы также хорошо обосновывают, почему этот подход может помочь в ситуациях, когда модель не совсем соответствует действительности. ## Результаты Для исследования авторы используют синтетические данные, а также реальные данные, подверженные шуму, например, данные, содержащие неточные метки. Они демонстрируют, что использование "label cleaning" повышает устойчивость модели к шуму и улучшает ее точность. В частности, они исследуют, как агрегирование меток помогает уменьшить шум в данных. Результаты показывают, что этот подход дает значительные выигрыши в ситуациях, где используются неточные метки, и может преобразовать классические модели в более устойчивые. ## Значимость Изученный подход имеет широкое применение в области машинного обучения, когда используются данные, подверженные шуму и неточностям. Он может быть применен в различных сценариях: 1. **Обработка данных** – улучшение качества данных путем удаления неточностей и шума. 2. **Машинное обучение** – улучшение точности моделей, используя более высококачествен
Annotation:
We demonstrate that learning procedures that rely on aggregated labels, e.g., label information distilled from noisy responses, enjoy robustness properties impossible without data cleaning. This robustness appears in several ways. In the context of risk consistency -- when one takes the standard approach in machine learning of minimizing a surrogate (typically convex) loss in place of a desired task loss (such as the zero-one mis-classification error) -- procedures using label aggregation obtain...
ID: 2509.11379v1 stat.ML, cs.LG, math.ST, stat.TH
Авторы:

Kisung You

## Контекст В поле видимости статистических моделей и анализа данных, рассматривается понятие **Wasserstein barycenter**, которое представляет собой расширение Евклидового среднего до множества вероятностных мер. Оно определяется как минимум задачи усреднения весовой суммы квадратов 2-Wasserstein-дисторбансов. Эта концепция находит приложение в задачах кластеризации, статистического обучения и работе с изображениями. Однако существующие методы, такие как регуляризация с помощью энтропии, ограничивают точность и стабильность решений. Мотивирует разработку новых подходов, которые были бы более строгими и эффективными. ## Метод Разработан **новый подход**, основанный на геометрической модели шаровых пространств, для вычисления Wasserstein barycenter. Без использования энтропии, метод использует **формальную римановскую геометрию** Wasserstein-пространства. Атомы барицентра, как частицы, двигаются по траекториям, возникающим из **адвекции в среднем по транспортным планам**. В случае отсутствия **Monge-переносов**, применяются **barycentric projections**. Этот подход позволяет сохранить геометрические особенности входных данных с минимальными вычислительными затратами. ## Результаты Использованы синтетические и реальные данные для проверки алгоритма. На синтетических данных показана четкость решений и точность алгоритма. На реальных данных (кластеризация изображений, байесовский анализ, агрегация постероритетов) получены результаты, которые демонстрируют **высокую точность** и **устойчивость** к погрешностям в данных. Алгоритм показал **гармоническое сочетание точности и производительности**, становясь конкурентоспособным в сравнении с традиционными методами. ## Значимость Полученный метод находит применение в **статистическом анализе**, **машинном обучении**, **графическом дизайне**. Он обеспечивает **высокую точность**, **устойчивость** и **уменьшает вычислительные затраты**. Благодаря принципиально новому подходу, алгоритм может использоваться в **больших масштабах** и в **реальном времени**, увеличивая эффективность в решении задач усреднения вероятностных мер. ## Выводы Разработанный **particle-flow-алгоритм** представляет собой **новый стандарт** для вычисления Wasserstein barycenter. Он комбинирует **точность**, **эффективность** и **теоретическую строгость**. Будущие исследования будут сконцентрированы на расширении применимости и оптимизации алгоритма для **больших данных** и **реального времени**.
Annotation:
The Wasserstein barycenter extends the Euclidean mean to the space of probability measures by minimizing the weighted sum of squared 2-Wasserstein distances. We develop a free-support algorithm for computing Wasserstein barycenters that avoids entropic regularization and instead follows the formal Riemannian geometry of Wasserstein space. In our approach, barycenter atoms evolve as particles advected by averaged optimal-transport displacements, with barycentric projections of optimal transport p...
ID: 2509.11435v2 stat.ML, cs.LG, stat.CO
Авторы:

Suman Cha, Hyunjoong Kim

#### Контекст Исключительное диспропорциональное распределение классов в задачах классификации, известное как несбалансированная классификация, является значительной проблемой, особенно в таких областях как медицинская диагностика и обнаружение мошенничества. Традиционные преобразовательные методы, такие как SMOTE и его модификации, стремятся уменьшить дисбаланс, генерируя синтетические обучающие образцы в меньшем классе. Однако эти методы часто не могут ловко ловить глобальные данные в высокомерных пространствах. Нейросетевые модели, основанные на генеративно-критических архитектурах (GANs), предлагают более тонкое моделирование распределения, но часто сталкиваются с проблемами, такими как нестабильность обучения и убыточность модов. Нашу работу построили на этой проблеме, стремясь разработать более эффективный подход для уменьшения дисбаланса в данных. #### Метод Мы предлагаем новую фреймворк, который вырабатывает параметрическую трансформацию для преобразования меньшинственных образцов в образцы множественного класса. Метод основывается на минимизации максимального отклонения среднего (MMD), чтобы глобально скорректировать распределение преобразованных образцов к истинным образцам меньшинственного класса. Для улучшения граничной осознанности и локального моделирования, мы включили триплетную функцию потерь, которая направляет сгенерированные образцы в зоны границ классов. Эта комбинация позволяет нам создать более точные и сбалансированные данные для обучения модели классификации. #### Результаты Мы проверили нашу модель на 29 синтетических и реальных данныхсетах. Гипотеза, что наш подход может превосходить традиционные и генеративные методы, подтвердилась. Мы получили значительные улучшения по метрикам, таким как AUROC, G-mean, F1-score, и MCC. Эти результаты подтверждают, что наш фреймворк является эффективным, надежным и высокопроизводительным для решения задач несбалансированной классификации. #### Значимость Наше решение может быть применено в различных критически важных задачах, таких как диагностика медицинских заболеваний, финансовый мониторинг и обнаружение мошенничества. Оно предлагает высокую скорость и точность, а также простоту в реализации в существующих классификационных моделях. Будущие исследования будут нацелены на улучшение структуры преобразовательного пространства и исследование других модификаций триплетной функции потерь для улучшения точности в сложных классификационных задачах. #### Выводы Мы предложили мощный фреймворк для преобразования меньшинственных образцов
Annotation:
Class imbalance in supervised classification often degrades model performance by biasing predictions toward the majority class, particularly in critical applications such as medical diagnosis and fraud detection. Traditional oversampling techniques, including SMOTE and its variants, generate synthetic minority samples via local interpolation but fail to capture global data distributions in high-dimensional spaces. Deep generative models based on GANs offer richer distribution modeling yet suffer...
ID: 2509.11511v1 stat.ML, cs.LG
Авторы:

Davide La Vecchia, Hang Liu

## Контекст Поиск эффективных методов оценивания робастности статистических моделей и машинного обучения является ключевым заданием в широком кругу приложений, от моделирования физических систем до анализа данных в медицине и финансах. Однако существующие подходы часто столкнуваются с проблемами, такими как высокая сложность вычислений, чувствительность к выбросам данных или неэффективность при работе с большими объемами данных. Такие ограничения приводят к необходимости разработки методов, обеспечивающих робастность и высокую скорость работы в различных областях. ## Метод Мы предлагаем **E-ROBOT** (Entropic-regularized Robust Optimal Transport), новую модель, которая объединяет робастность **ROBOT** (Robust Optimal Transport) с выгодами **энтропийной регуляризации**. Метод основывается на **теории Шредингеровой жёсткости**, которая позволяет определить **параметризованный синхронно-инвариантный распределение**. На практике, это даёт возможность оптимизировать робастность с помощью класса **Sinkhorn divergence**, которая зависит от двух параметров: **\lambda** (контролирующего робастность) и **\varepsilon** (контролирующего регуляризацию). Эта гибкость позволяет уменьшить чувствительность к выбросам и оптимизировать сложность вычислений в задачах с большим количеством данных. ## Результаты Мы проверили E-ROBOT в четырёх различных сценариях: 1. **Goodness-of-fit тестирование**: проверка соответствия данных распределению. 2. **Компьютерное зрение**: вычисление барицентров для повреждённых 2D и 3D фигур. 3. **Градиентные потоки**: определение динамики в задачах машинного обучения. 4. **Image color transfer**: цветовое преобразование между изображениями. В каждом случае, мы показали, что **E-ROBOT** демонстрирует высокую робастность и эффективность, даже при работе с высокомерностьными данными. Например, при тестировании распределений, мы получили точность с **\mathcal{O}(n^{-1/2})**, что позволяет избежать **curse of dimensionality**, обычного для традиционных методов. ## Значимость E-ROBOT может использоваться в следующих областях: - **Машинное обучение**: для робастных задач классификации и регрессии. - **Статистический анализ**: для выявления выбросов и тестирования гипотез. - **Робототехника и компьютерное зрение**: для задач исправления и преобразования данных. Помимо высокой робастности и скорости работы, E-ROBOT также обеспечивает диапазон преимуществ, таких как уменьшение влияния выбросов и расширение возможностей для масштабируемых задач. ## Выводы Мы представили E-ROBOT, новый метод, который успешно комбинирует робастность и высокую скорость работы в задачах статистического анализа и
Annotation:
We propose the Entropic-regularized Robust Optimal Transport (E-ROBOT) framework, a novel method that combines the robustness of ROBOT with the computational and statistical benefits of entropic regularization. We show that, rooted in the Schr\"{o}dinger bridge problem theory, E-ROBOT defines the robust Sinkhorn divergence $\overline{W}_{\varepsilon,\lambda}$, where the parameter $\lambda$ controls robustness and $\varepsilon$ governs the regularization strength. Letting $n\in \mathbb{N}$ denote...
ID: 2509.11532v1 stat.ML, cs.LG
Авторы:

Rodrigue Govan, Romane Scherrer, Philippe Fournier-Viger, Nazha Selmaoui-Folcher

#### Контекст Графовые нейронные сети (Graph Neural Networks, GNNs) широко используются для решения задач на основе графов в различных областях, таких как социальные сети, биология и технические приложения. Однако, при работе с большими графами, эффективность обучения и вывода может существенно ухудшиться из-за высокого порога вычислительных и памяти затрат. Это приводит к необходимости в методах, эффективно сокращающих размер графа при сохранении структурных свойств и информации. Существуют существующие методы пулинга, такие как SAGPool и ASAP, которые решают эту проблему, но имеют ограничения в точности и эффективности. Существует мотивация для разработки более универсального метода, который мог бы комбинировать два подхода: дружественных к масштабу и точности. #### Метод SpaPool (Soft Partition Assignment Pooling) представляет собой новый метод пулинга, который объединяет преимущества двух доминирующих подходов: денсного и спарсеного. Метод разбивает вершины графа на адаптивное число кластеров, используя нейронную сеть для определения принадлежности к кластерам. Подход гарантирует оптимальный баланс между сохранением структурной информации и эффективностью. Архитектура SpaPool состоит из двух этапов: начальной фазы кластеризации и финальной фазы синтеза. В первой фазе, нейронная сеть вычисляет вероятности принадлежности каждой вершине к каждому кластеру. Во второй фазе, эти вероятности используются для создания оптимальных кластеров, которые будут сохранять самую важную информацию графа. #### Результаты Эксперименты проводились на двух различных типах данных, включая данные реальных графов и синтетические графы. Метод SpaPool сравнивался с двумя центральными методами: SAGPool и ASAP. Результаты показали, что SpaPool демонстрирует более высокую точность и эффективность на малых графах, а также существенно уменьшает вычислительные затраты на больших графах. Эти результаты подтверждают, что SpaPool является более гибким и эффективным методом, чем существующие. #### Значимость SpaPool может быть применен в различных областях, таких как социальные сети, биология и технические приложения, где необходимо обработать большие графы с ограниченными ресурсами. Уникальный подход SpaPool также может быть использован для повышения эффективности и точности в приложениях, использующих машинное обучение на графах. Это делает SpaPool важной концепцией в развитии новых технологий в области GNNs. #### Выводы Разработанный SpaPool является первым методом, который эффективно комбинирует два подхода к пулингу. На основании резуль
Annotation:
This paper introduces SpaPool, a novel pooling method that combines the strengths of both dense and sparse techniques for a graph neural network. SpaPool groups vertices into an adaptive number of clusters, leveraging the benefits of both dense and sparse approaches. It aims to maintain the structural integrity of the graph while reducing its size efficiently. Experimental results on several datasets demonstrate that SpaPool achieves competitive performance compared to existing pooling technique...
ID: 2509.11675v1 stat.ML, cs.LG
Авторы:

Mika Sipilä, Klaus Nordhausen, Sara Taskinen

## Контекст Многомерные спектро- и спектро-временные данные широко распространены в различных областях науки и технологий, включая метеорологию, экологию, геологию и биологию. Однако их моделирование и прогнозирование представляют собой сложную задачу, поскольку эти данные часто имеют сложную структуру, включающую независимые компоненты, корреляции по времени и пространству, а также изменчивость. Классические методы, такие как PCA или ICA, не всегда эффективны для таких сложных задач. Нейронные сети, особенно вариационные автоэнкодеры, показали свою эффективность в решении подобных задач, но часто не обеспечивают идентификации линейных или нелинейных компонент. Необходимо разработать метод, который обеспечивает идентификацию компонентов и эффективно работает с нелинейными и нестационарными зависимостями. ## Метод Мы предлагаем идентифицируемый авторегрессионный вариационный автоэнкодер (Identifiable Autoregressive Variational Autoencoder, IAR-VAE), который использует авторегрессионные модели для описания нестационарных процессов внутри нейронной сети. Основная идея заключается в использовании вариационного автоэнкодера для декомпузирования входных данных, при этом компоненты данных обусловлены независимо друг от друга с учетом временных и пространственных зависимостей. Мы используем регуляризационные слои для обеспечения идентификации компонентов и убедиться, что каждая компонента может быть однозначно отображена на исходные данные. Метод протестирован на синтетических и реальных данных, включая данные о загрязнении воздуха и атмосферных условиях. ## Результаты Мы провели эксперименты на синтетических данных, которые подтвердили, что IAR-VAE эффективно разделяет нестационарные компоненты и обеспечивает идентификацию их значимости. Также мы проверили метод на данных по окружающей среде и погоде, где он показал отличные результаты по сравнению с другими современными методами. Например, на данных по загрязнению воздуха IAR-VAE показал значительно лучшую точность в прогнозировании, чем стандартные методы, такие как PCA или традиционные вариационные автоэнкодеры. ## Значимость Метод IAR-VAE может быть применен в различных областях, где требуется определить и моделировать нестационарные процессы в пространственно-временных данных. Он имеет приложения в климатических исследованиях, моделировании экологических процессов, прогнозировании атмосферных условий и других сложных задачах. Одним из основных преимуществ IAR-VAE является возможность однозначно определять компоненты, что делает его эффективным для решения задач с большим количеством переменных. Будущие исследования б
Annotation:
The modeling and prediction of multivariate spatio-temporal data involve numerous challenges. Dimension reduction methods can significantly simplify this process, provided that they account for the complex dependencies between variables and across time and space. Nonlinear blind source separation has emerged as a promising approach, particularly following recent advances in identifiability results. Building on these developments, we introduce the identifiable autoregressive variational autoencod...
ID: 2509.11962v1 stat.ML, cs.LG, stat.ME
Показано 421 - 430 из 564 записей