📊 Статистика дайджестов

Всего дайджестов: 34123 Добавлено сегодня: 101

Последнее обновление: сегодня

📄 Forecasting precipitation in the Arctic using probabilistic machine learning informed by causal climate drivers

2025-10-30

Авторы:

Madhurima Panja, Dhiman Das, Tanujit Chakraborty, Arnob Ray, R. Athulya, Chittaranjan Hens, Syamal K. Dana, Nuncio Murukesh, Dibakar Ghosh

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Understanding and forecasting precipitation events in the Arctic maritime environments, such as Bear Island and Ny-{\AA}lesund, is crucial for assessing climate risk and developing early warning systems in vulnerable marine regions. This study proposes a probabilistic machine learning framework for modeling and predicting the dynamics and severity of precipitation. We begin by analyzing the scale-dependent relationships between precipitation and key atmospheric drivers (e.g., temperature, relati...

ID: 2510.24254v1 physics.ao-ph, cs.LG, physics.data-an

arXiv PDF

📄 Transfer Learning Beyond the Standard Model

2025-10-25

Авторы:

Veena Krishnaraj, Adrian E. Bayer, Christian Kragh Jespersen, Peter Melchior

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Machine learning enables powerful cosmological inference but typically requires many high-fidelity simulations covering many cosmological models. Transfer learning offers a way to reduce the simulation cost by reusing knowledge across models. We show that pre-training on the standard model of cosmology, $\Lambda$CDM, and fine-tuning on various beyond-$\Lambda$CDM scenarios -- including massive neutrinos, modified gravity, and primordial non-Gaussianities -- can enable inference with significantl...

ID: 2510.19168v1 astro-ph.CO, astro-ph.IM, cs.LG, physics.data-an

arXiv PDF

📄 Reliable data clustering with Bayesian community detection

2025-10-21

Авторы:

Magnus Neuman, Jelena Smiljanić, Martin Rosvall

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

From neuroscience and genomics to systems biology and ecology, researchers rely on clustering similarity data to uncover modular structure. Yet widely used clustering methods, such as hierarchical clustering, k-means, and WGCNA, lack principled model selection, leaving them susceptible to noise. A common workaround sparsifies a correlation matrix representation to remove noise before clustering, but this extra step introduces arbitrary thresholds that can distort the structure and lead to unreli...

ID: 2510.15013v1 stat.ML, cs.LG, physics.data-an, stat.ME

arXiv PDF

📄 MCbiF: Measuring Topological Autocorrelation in Multiscale Clusterings via 2-Parameter Persistent Homology

2025-10-18

Авторы:

Juni Schindler, Mauricio Barahona

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Datasets often possess an intrinsic multiscale structure with meaningful descriptions at different levels of coarseness. Such datasets are naturally described as multi-resolution clusterings, i.e., not necessarily hierarchical sequences of partitions across scales. To analyse and compare such sequences, we use tools from topological data analysis and define the Multiscale Clustering Bifiltration (MCbiF), a 2-parameter filtration of abstract simplicial complexes that encodes cluster intersection ...

ID: 2510.14710v1 math.AT, cs.LG, physics.data-an, Primary 55N31, Secondary 62H30

arXiv PDF

📄 Detail Across Scales: Multi-Scale Enhancement for Full Spectrum Neural Representations

2025-09-23

Авторы:

Yuan Ni, Zhantao Chen, Cheng Peng, Rajan Plumley, Chun Hong Yoon, Jana B. Thayer, Joshua J. Turner

## Контекст Implicit neural representations (INRs) представляют собой мощный подход к кодированию данных, использующий нейронные сети для представления информации без непосредственного хранения в массивах. Это позволяет достичь резолюционной независимости и эффективного потребления ресурсов памяти. Однако существующие INR-подходы часто сталкиваются с проблемами в точном воспроизведении многомерных структур, высокочастотной информации и тонких текстур, которые характерны для многих научных данных. Такие ограничения приводят к потере тонких деталей и неэффективному использованию моделей, что ограничивает применение INR в областях, требующих высокой точности и эффективности. ## Метод Предлагаемый подход, **WIEN-INR**, расширяет INR, используя модель волнового ряда для распределения моделирования по разным разрешениям. В основе WIEN-INR лежит идея разделения задачи на несколько уровней разрешения, где каждый уровень специально сконцентрирован на задаче восстановления деталей. Наиболее тонкие детали восстанавливаются с помощью специальной модели на основе волнового ряда, которая применяется на гладких месте карты нейронных представлений. Это позволяет использовать компактные модели, сохраняя полный диапазон информации и эффективность обучения. ## Результаты Исследования проводились на различных научных наборах данных, характеризующих различные масштабы и структуры. Результаты показали, что WIEN-INR использует меньшую модель, чем существующие подходы, но достигает значительно более высокой точности воспроизведения деталей. Эта модель эффективно обрабатывает многомерные данные, сохраняя весь диапазон структур и текстур, что делает ее применимую в сложных научных задачах, где требуется высокая точность и эффективность. ## Значимость Предлагаемый подход может быть применен в различных научных и практических областях, где требуется высокая точность воспроизведения деталей, таких как медицина, симуляции физических процессов и анализ высокого разрешения. WIEN-INR предоставляет полный спектр преимуществ, включая эффективность в памяти, гибкость и точность. Это делает его привлекательным для задач, где необходимо обработать и хранить большие объемы информации с минимальными затратами. ## Выводы WIEN-INR представляет собой эффективное решение для вопросов, связанных с воспроизведением многомерных данных, и расширяет применение INR в области научных и практических задач. Будущие исследования будут фокусироваться на повышении эффективности, расширении применений и исследовании других подходов к восстановлению деталей в нейронных

Annotation:

Implicit neural representations (INRs) have emerged as a compact and parametric alternative to discrete array-based data representations, encoding information directly in neural network weights to enable resolution-independent representation and memory efficiency. However, existing INR approaches, when constrained to compact network sizes, struggle to faithfully represent the multi-scale structures, high-frequency information, and fine textures that characterize the majority of scientific datase...

ID: 2509.15494v1 cs.LG, physics.data-an

arXiv PDF

📄 Stochastic Clock Attention for Aligning Continuous and Ordered Sequences

2025-09-20

Авторы:

Hyungjoon Soh, Junghyo Jo

## Контекст Современные подходы в обработке и анализе данных часто сталкиваются с задачами построения моделей, которые обрабатывают и анализируют последовательности данных, которые могут быть как конт contiного, так и последовательного характера. Несмотря на то, что многие подходы, такие как Transformer, успешно справляются с этими задачами, они часто страдают от проблем с менее ясной моделью взаимосвязей между элементами в последовательностях. Это приводит к ошибкам в моделировании временных рядов, текстов или изображений. Задача построения моделей, которые могут лучше подходить для работы с такими последовательностями, является ключевой мотивацией для развития новых методов. ## Метод Статья предлагает новый подход к моделированию взаимосвязей в последовательностях, который называется Stochastic Clock Attention. Основной идеей является использование гибридной модели, в которой используется "стохастическое часовое значение", изменяющееся в зависимости от того, где находится последовательность. Этот метод позволяет более точно определять взаимосвязи между элементами последовательности, в том числе в тех случаях, когда последовательность имеет непрерывный и последовательный характер. Эта модель построена на основе процесса Monte Carlo и предлагает новый подход к расчету взаимосвязи между элементами последовательности с использованием вероятностной модели, что позволяет оптимизировать результаты моделирования. ## Результаты В рамках исследования проведены несколько экспериментов, в которых использовались разные типы последовательностей, включая текст, звуковые сигналы и видео. На основе результатов этих экспериментов были получены несколько выводов: 1) Модель Stochastic Clock Attention показала себя эффективнее существующих моделей в моделировании временных рядов. 2) Она предоставляет более точные результаты, особенно когда требуется принять во внимание логику последовательности и монотонность в последовательности. 3) Модель продемонстрировала лучшую устойчивость к глобальным изменениям во времени, что является ключевым преимуществом в некоторых задачах, таких как обработка текста и видео. ## Значимость Результаты работы показали, что модель Stochastic Clock Attention может быть применена в различных областях, включая моделирование текстов, видео и звуковых сигналов. Основные преимущества этой модели заключаются в том, что она предоставляет более точные и устойчивые результаты в моделировании последовательностей, а также позволяет лучше принять во внимание логику взаимосвязей в последовательностях. Это может быть ключевым критерием для улучшения точности моделей в различных приложениях, таких как синтез ре

Annotation:

We formulate an attention mechanism for continuous and ordered sequences that explicitly functions as an alignment model, which serves as the core of many sequence-to-sequence tasks. Standard scaled dot-product attention relies on positional encodings and masks but does not enforce continuity or monotonicity, which are crucial for frame-synchronous targets. We propose learned nonnegative \emph{clocks} to source and target and model attention as the meeting probability of these clocks; a path-int...

ID: 2509.14678v1 cs.LG, physics.data-an

arXiv PDF

📄 Artificial neural networks ensemble methodology to predict significant wave height

2025-09-19

Авторы:

Felipe Crivellaro Minuzzi, Leandro Farina

#### Контекст Прогнозирование волновых параметров, в том числе значимой высоты волн (Significant Wave Height, SWH), является ключевой задачей для многих приложений, зависящих от точного описания состояния океана. Несмотря на прогрессы в технических и вычислительных технологиях, прогнозирование сильных волн продолжает представлять сложности, возникающими из-за катастрофического характера океанового движения и относительной сложности математических моделей. Обычно решение этой задачи осуществляется с помощью различных моделей и многопараметрических стратегий, включая вариации инициальных условий и ансамблирование результатов. В последние годы роль машинного обучения (ML) усилилась, так как высокопроизводительные вычислительные системы стали доступнее. Машинное обучение применяется как альтернативные модели к традиционным методам, порой превосходя их в точности и эффективности. Наша работа основывается на построении ансамбля нейронных сетей для прогноза SWH в шести различных точках на берегу Бразилии. #### Метод Методология проектирует ансамбль из нескольких архитектур нейронных сетей, включая Многослойный перцептрон (MLP), Рекуррентную нейронную сеть (RNN), Длительностно-рекуррентную нейронную сеть (LSTM), Конволюционную нейронную сеть (CNN) и гибридную CNN-LSTM. Эти сети обучаются на данных NOAA (National Oceanic and Atmospheric Administration) с использованием синтетических задач регрессии. Целевая переменная — разница между выходами номинальной модели и наблюдаемыми данными. Мы предложили новую стратегию подготовки данных, включающую в себя извлечение изолированных сегментов данных для каждого местоположения. Данные обработаны с использованием трюка с нормализацией и агрегацией. Эта стратегия позволяет оптимизировать обучение и достичь более высокой точности. #### Результаты Мы провели эксперименты на шести различных точках без привязки к методу ансамбля, чтобы оценить качество прогноза SWH. Эталонным является NOAA's numerical model, а результаты сравнивались по нескольким метрикам. Наш ансамбль показал среднюю точность $80\%$, с максимальным значением $88\%$, что соответствует сокращению ошибки в $5\%$ по сравнению с базовой моделью. Это достигнуто при значительном сокращении вычислительных затрат, что делает нашу модель эффективнее. Эти результаты указывают на мощность ансамбля для решения задачи прогноза SWH с повышенной точностью и экономичностью. #### Значимость Наш прогностический подход может быть использован в различных приложениях, включая мониторинг морского подъема, логистику, а также геологические исследования. Особенно важна его значи

Annotation:

The forecast of wave variables are important for several applications that depend on a better description of the ocean state. Due to the chaotic behaviour of the differential equations which model this problem, a well know strategy to overcome the difficulties is basically to run several simulations, by for instance, varying the initial condition, and averaging the result of each of these, creating an ensemble. Moreover, in the last few years, considering the amount of available data and the com...

ID: 2509.14020v1 physics.ao-ph, cs.LG, physics.data-an, 68T07, 86A05, 68T05, I.2.6; J.2; G.3

arXiv PDF

📄 OASIS: A Deep Learning Framework for Universal Spectroscopic Analysis Driven by Novel Loss Functions

2025-09-17

Авторы:

Chris Young, Juejing Liu, Marie L. Mortensen, Yifu Feng, Elizabeth Li, Zheming Wang, Xiaofeng Guo, Kevin M. Rosso, Xin Zhang

## Контекст Спектроскопические данные широко распространены в различных научных и инженерных областях, требуя эффективных методов их обработки и анализа. Одним из ключевых проблем, стоящих перед авторами, являются ограничениями традиционных методов, которые часто требуют ручного вмешательства и являются технологически специфичными. Это приводит к неэффективности, потере времени и повышенной вероятности ошибок. Мотивацией для разработки OASIS (Omni-purpose Analysis of Spectra via Intelligent Systems) служила необходимость в универсальном, технологически независимом и автоматизированном подходе к анализу спектров. ## Метод OASIS — это машинное обучение (ML) фреймворк, разработанный для технологически независимого анализа спектров. Основными этапами его работы являются данное искажение, коррекция базей, а также восстановление параметров пиков (расположение, интенсивность, FWHM). Основное отличие OASIS заключается в разработке и использовании инновационных, задач-специфических функций потерь. Например, функция ViPeR (Vicinity Peak Response) предназначена для точного определения расположения пиков. Фреймворк обучается на синтетической выборке, содержащей признаки с различных спектроскопических методов, что обеспечивает широкий спектр приложений. Архитектура OASIS основывается на компактных моделях, которые подтвердили свою точность в процессе валидации с данными полученными от Рамановской, UV-видивой и флуоресцентной спектроскопии. ## Результаты Эксперименты показали, что OASIS эффективно выполняет стандартные задачи спектроскопии, включая данное искажение, коррекцию базей и восстановление параметров пиков. Данные для валидации были получены из реальных экспериментов в рамках трех различных методов спектроскопии: Рамановской, UV-видивой и флуоресцентной. Результаты показали высокую точность восстановления параметров, даже при низком качестве входных данных. Благодаря использованию задач-специфических функций потерь, OASIS удалось достичь высокой точности с меньшим количеством параметров модели, что делает его высокоэффективным для использования в реальных условиях. ## Значимость OASIS может быть применен в различных сферах, таких как виртуальные эксперименты, оптимизация процессов и онлайн-мониторинг. Важной особенностью является то, что новые задач-специфические функции потерь, такие как ViPeR, демонстрируют перспективу оптимизации машинного обучения для спектроскопии. Это не только повышает точность, но также экономит ресурсы, что делает OASIS более доступным для широкого круга поль

Annotation:

The proliferation of spectroscopic data across various scientific and engineering fields necessitates automated processing. We introduce OASIS (Omni-purpose Analysis of Spectra via Intelligent Systems), a machine learning (ML) framework for technique-independent, automated spectral analysis, encompassing denoising, baseline correction, and comprehensive peak parameter (location, intensity, FWHM) retrieval without human intervention. OASIS achieves its versatility through models trained on a stra...

ID: 2509.11499v1 cs.LG, physics.data-an

arXiv PDF

📄 Variational Garrote for Statistical Physics-based Sparse and Robust Variable Selection

2025-09-10

Авторы:

Hyungjoon Soh, Dongha Lee, Vipul Periwal, Junghyo Jo

#### Контекст В настоящее время выбор ключевых переменных из высокомерных данных является важной задачей в области больших данных. Методы регрессии, ориентированные на малое число переменных, являются мощным инструментом для решения этой проблемы, так как они обеспечивают модельность, легкую для понимания и объяснения. В данной работе мы возобновляем исследования по статистической физике-ориентированному методу Variational Garrote (VG), который вводит специальные спин-переменные для выбора функций и использует вариационный инференс для получения лосса, оптимизируемого теоретически. Мы расширяем метод VG, используя современные технологии автоматической дифференциации, что позволяет эффективно оптимизировать и стабильно использовать этот подход. Мы проверили VG на основе как синтетических, так и реальных высокомерных данных. Наши результаты показывают, что VG обеспечивает более точный и устойчивый выбор переменных по сравнению с Ridge и LASSO регрессиями при различных уровнях спаса. Мы также выявили критическую точку, при которой добавление лишних переменных приводит к существенному снижению общей точности и повышению неопределенности выбранных переменных. Эта точка может служить практическим признаком для определения правильного числа важностных переменных. #### Метод Мы использовали вариационный подход для решения задачи выбора переменных в высокомерных данных. Метод VG включает в себя специальные спин-переменные, которые позволяют явно выделить важные функции. Мы использовали автоматическую дифференциацию для оптимизации лосса, что делает VG более удобным в использовании и эффективным в обработке больших данных. Мы проводили эксперименты с использованием как синтетических, так и реальных данных, чтобы изучить точность выбора переменных и устойчивость VG. Мы также проанализировали, как размер сетки влияет на качество модели и возможность выбора важностных переменных. #### Результаты Мы провели эксперименты с различными уровнями спаса и данными, чтобы проверить VG по сравнению с другими методами, такими как Ridge и LASSO регрессии. Наши результаты показали, что VG обеспечивает более высокую точность и устойчивость выбора переменных в ситуациях с высоким спасом. Мы также выявили критическую точку, в которой добавление лишних переменных приводит к существенному снижению качества модели. Этот переход может быть использован для определения правильного числа важностных переменных. Мы также проследили, как размер выборки и другие факторы влияют на эффективность VG, и установили, что он демонстрирует высокую точность в различных условиях. #### Значимость Метод VG может использоваться в различных приложениях, таких как сжа

Annotation:

Selecting key variables from high-dimensional data is increasingly important in the era of big data. Sparse regression serves as a powerful tool for this purpose by promoting model simplicity and explainability. In this work, we revisit a valuable yet underutilized method, the statistical physics-based Variational Garrote (VG), which introduces explicit feature selection spin variables and leverages variational inference to derive a tractable loss function. We enhance VG by incorporating modern ...

ID: 2509.06383v1 cs.LG, physics.data-an

arXiv PDF

📄 Fisher information flow in artificial neural networks

2025-09-06

Авторы:

Maximilian Weimar, Lukas M. Rachbauer, Ilya Starshynov, Daniele Faccio, Linara Adilova, Dorian Bouchet, Stefan Rotter

## Контекст Анализ и оценка неизвестных параметров из входных данных широко распространены в физике и других областях наук. Оценка этих параметров часто зависит от того, насколько эффективно система сохраняет и передает информацию о неизвестных предметных свойствах. Одним из ключевых показателей эффективности является Fisher information, который измеряет степень передачи информации о параметрах через физическую систему. С растущим применением Artificial Neural Networks (ANNs) в различных задачах, включая визуальный анализ и обработку изображений, возникает необходимость понимания, как эти сети обрабатывают и передают Fisher information. Наша мотивация заключается в разработке метода, позволяющего отслеживать Fisher information flow внутри ANN, чтобы оптимизировать его использование и избежать проблем, таких как overfitting. ## Метод Мы развиваем метод, который позволяет отслеживать Fisher information flow в сети нейронных сетей, действующей в задаче оценки параметров. Метод включает в себя моделирование оптимального flow внутри сети при помощи дифференциальных уравнений и распространения Fisher information от входа до выхода. Мы используем методы линейных систем и нейросетевых анализов, чтобы выявлять внутренний параметрический flow и определять точки максимального и минимального значения Fisher information. Эта модель позволяет отслеживать и оптимизировать систему в реальном времени, определяя момент максимальной эффективности сети. ## Результаты Мы проводим эксперименты на нескольких ANNs с различными архитектурами и задачами, включая задачу оценки параметров на основе изображений. Мы отслеживаем Fisher information flow внутри сетей, проводя анализ в матрицах информационных потоков. Наши результаты показывают, что сети, достигшие оптимального Fisher information flow, достигают наиболее высокой точности в оценке параметров. Мы также проверяем, что при overfitting происходит Fisher information loss, что демонстрируется в наших экспериментах. Наши результаты показывают, что Fisher information flow может быть использован для определения оптимального момента для остановки обучения сети, устраняя необходимость в отдельной validation dataset. ## Значимость Метод, представленный в нашей работе, имеет широкие применения в области оценки параметров в физике и других областях науки, где используются ANNs. Наша работа демонстрирует, что Fisher information flow может быть использован в качестве обоснованного и модельно-свободного метода для оптимизации обучения сетей нейронных сетей. Это позволяет избежать затрат на дополнительные данные для validation, обеспечивая эффективность обучения. Мы также показываем, что наш метод может быть применен к реальным физическим системам, включая задачи визуальной обработки данных, что демонстрирует его практическую значимость. ## Выводы Мы предлагаем м

Annotation:

The estimation of continuous parameters from measured data plays a central role in many fields of physics. A key tool in understanding and improving such estimation processes is the concept of Fisher information, which quantifies how information about unknown parameters propagates through a physical system and determines the ultimate limits of precision. With Artificial Neural Networks (ANNs) gradually becoming an integral part of many measurement systems, it is essential to understand how they ...

ID: 2509.02407v1 cs.LG, physics.data-an

arXiv PDF

Показано 11 - 20 из 27 записей