📊 Статистика дайджестов

Всего дайджестов: 34123 Добавлено сегодня: 101

Последнее обновление: сегодня
Авторы:

Arthur Pellegrino, Angus Chadwick

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Analysing how neural networks represent data features in their activations can help interpret how they perform tasks. Hence, a long line of work has focused on mathematically characterising the geometry of such "neural representations." In parallel, machine learning has seen a surge of interest in understanding how dynamical systems perform computations on time-varying input data. Yet, the link between computation-through-dynamics and representational geometry remains poorly understood. Here, we...
ID: 2512.04310v1 cs.LG, math.DG, math.DS, q-bio.NC
Авторы:

Dong Liu

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
We propose Fiber Bundle Networks (FiberNet), a novel machine learning framework integrating differential geometry with machine learning. Unlike traditional deep neural networks relying on black-box function fitting, we reformulate classification as interpretable geometric optimization on fiber bundles, where categories form the base space and wavelet-transformed features lie in the fibers above each category. We introduce two innovations: (1) learnable Riemannian metrics identifying important fr...
ID: 2512.01151v1 cs.LG, math.DG
Авторы:

Charles Fefferman, Jonathan Marty, Kevin Ren

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
We consider the problem of reconstructing the intrinsic geometry of a manifold from noisy pairwise distance observations. Specifically, let $M$ denote a diameter 1 d-dimensional manifold and $μ$ a probability measure on $M$ that is mutually absolutely continuous with the volume measure. Suppose $X_1,\dots,X_N$ are i.i.d. samples of $μ$ and we observe noisy-distance random variables $d'(X_j, X_k)$ that are related to the true geodesic distances $d(X_j,X_k)$. With mild assumptions on the distribut...
ID: 2511.13025v1 stat.ML, cs.LG, math.DG, math.PR
Авторы:

Andrin Rehmann, Nolan Black, Josiah Bjorgaard, Alessandro Angioi, Andrei Paleyes, Niklas Heim, Dion Häfner, Alexander Lavin

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Gradient-based optimization of engineering designs is limited by non-differentiable components in the typical computer-aided engineering (CAE) workflow, which calculates performance metrics from design parameters. While gradient-based methods could provide noticeable speed-ups in high-dimensional design spaces, codes for meshing, physical simulations, and other common components are not differentiable even if the math or physics underneath them is. We propose replacing non-differentiable pipelin...
ID: 2511.10761v1 cs.CE, cs.AI, cs.LG, math.DG
Авторы:

Willem Diepeveen, Melanie Weber

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
High-dimensional data that exhibit an intrinsic low-dimensional structure are ubiquitous in machine learning and data science. While various approaches allow for learning the corresponding data manifold from finite samples, performing downstream tasks such as optimization directly on these learned manifolds presents a significant challenge. This work introduces a principled framework for optimization on learned data manifolds using iso-Riemannian geometry. Our approach addresses key limitations ...
ID: 2510.21033v1 math.OC, cs.LG, math.DG, 90C26, 68T07, 53Z50
Авторы:

Amandip Sangha

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
We present a geometric formulation of automatic differentiation (AD) using jet bundles and Weil algebras. Reverse-mode AD emerges as cotangent-pullback, while Taylor-mode corresponds to evaluation in a Weil algebra. From these principles, we derive concise statements on correctness, stability, and complexity: a functorial identity for reverse-mode, algebraic exactness of higher-order derivatives, and explicit bounds on truncation error. We further show that tensorized Weil algebras permit one-pa...
ID: 2510.14342v1 cs.LG, math.DG, stat.ML
Авторы:

Dhruv Kohli, Sawyer J. Robertson, Gal Mishne, Alexander Cloninger

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Estimating the tangent spaces of a data manifold is a fundamental problem in data analysis. The standard approach, Local Principal Component Analysis (LPCA), struggles in high-noise settings due to a critical trade-off in choosing the neighborhood size. Selecting an optimal size requires prior knowledge of the geometric and noise characteristics of the data that are often unavailable. In this paper, we propose a spectral method, Laplacian Eigenvector Gradient Orthogonalization (LEGO), that utili...
ID: 2510.02308v1 cs.LG, math.DG
Авторы:

Albert Kjøller Jacobsen, Johanna Marie Gegenfurtner, Georgios Arvanitidis

## Контекст Область исследования сосредоточена на изучении методов применения геометрически ориентированного шума во время обучения глубоких нейронных сетей. Данный подход направлен на улучшение регуляризации, обеспечения гладкости моделей и улучшения их общей устойчивости и точности. Однако, существующие исследования сфокусированы на добавлении амбиентного шума в входном пространстве, не учитывая особенности низкорангового многообразия, на котором лежит данные. Работа предлагает новые методы геометрически ориентированной инъекции шума, которые учитывают эту структуру. Это необходимо для решения проблем, связанных с высокой кривизной многообразий, на которых обучаются нейронные сети. ## Метод Метод предлагает добавлять шум в входные данные в том пространстве, которое соответствует низкоранговому многообразию, на котором данные лежат. Это достигается путем проекции гауссовского шума на локальное тангенциальное пространство многообразия. Далее, этот шум маппится на многообразие с помощью геодезической кривой. Также рассматривается шум в виде Броуновского движения, который делает случайные шаги вдоль геодезических кривых. Это позволяет сохранить геометрические особенности многообразия и улучшить генерализацию моделей. ## Результаты Изучены эффекты разных видов шума на нескольких многообразиях с разной кривизной. Эксперименты показали, что геометрически ориентированный шум существенно улучшает производительность моделей на высококривых многообразиях, увеличивая их общую устойчивость и точность. На простых многообразиях результаты находятся на уровне с обучением без добавления шума. Эксперименты также показали, что шум не влияет на скорость обучения и может быть эффективно применен как на предобработанных, так и на любых других многообразиях, созданных с помощью глубоких нейронных сетей. ## Значимость Предложенный подход может быть применен в различных областях, где необходимо увеличить устойчивость моделей к выбросам в данных и улучшить их общую производительность на высококривых многообразиях. Он показал преимущество в области обучения с подкреплением, где геометрически ориентированный шум позволил достичь более стабильных и точных результатов. Будущие исследования будут сфокусированы на расширении этого подхода для работы с неоднородными многообразиями и исследовании его применения в мультимодальных задачах обучения. ## Выводы Результаты показали, что геометрически ориентированный шум значительно улучшает результаты моделей, особенно на высококривых многообраз
Annotation:
It has been shown that perturbing the input during training implicitly regularises the gradient of the learnt function, leading to smoother models and enhancing generalisation. However, previous research mostly considered the addition of ambient noise in the input space, without considering the underlying structure of the data. In this work, we propose several methods of adding geometry-aware input noise that accounts for the lower dimensional manifold the input space inhabits. We start by proje...
ID: 2509.20201v1 cs.LG, math.DG, stat.ML
Авторы:

Govind Menon, Tianmin Yu

## Контекст Обучение нейронных сетей с глубокими архитектурами является задачей ключевой во многих областях, включая обработку естественного языка, обработку изображений и распознавание речи. Однако во время обучения моделей наблюдается сильная нестабильность, которая может быть связана с огромным числом параметров и ограниченным количеством данных для обучения. Эта проблема хорошо изучена в линейных нейронных сетях, но менее четко понятна в случае глубоких нейронных сетей. Данное исследование вводит понятие "глубокой линейной сети" (Deep Linear Network, DLN) и исследует её геометрию, чтобы дать фундамент для термодинамического описания обучения нейронных сетей. Основной мотивацией является создание модели, которая может объяснить и упростить понимание процесса обучения в DLN. ## Метод Исследование основывается на римановой геометрии и групповых действий. Авторы используют подход, основанный на группах, для анализа переобозначения (overparametrization) в DLN. Основной технический шаг — конструкция ортонормированного базиса для тангенсного пространства балансированного многообразия (balanced manifold) с помощью теории Якоби-матриц. Архитектура исследования включает использование Riemannian submersion для перехода от пространства параметров к пространству обобщенных параметров. Модель также использует концепт Больцмановского энтропии, определяемого через листья многообразия в пространстве параметров. ## Результаты Авторы вводят формулу для Больцмановской энтропии в DLN, которая лежит в основе термодинамической модели обучения. Также они показывают, что Riemannian geometry, определенная на пространстве обобщенных параметров, может быть получена через Riemannian submersion из балансированного многообразия. Экспериментальные результаты показывают, что использование такого подхода позволяет получить более точные прогнозы и улучшить понимание процесса обучения в DLN. ## Значимость Модель DLN и её геометрия могут быть применены в различных областях, таких как машинное обучение, анализ данных и физическое моделирование. Основное преимущество метода заключается в том, что он обеспечивает новый взгляд на процесс обучения в глубоких нейронных сетях, упрощая понимание и улучшая стабильность. Потенциальное влияние заключается в том, что данный подход может помочь в решении проблемы переобучения и нестабильности в DLN, что в свою очередь может привести к более эффективным моделям и более точным результатам. ## Выводы В ходе исследования была предложена формула для Больцмановской энтропии в DLN, которая может стать основой для термодинамической модели обучения. Так
Annotation:
We study the Riemannian geometry of the Deep Linear Network (DLN) as a foundation for a thermodynamic description of the learning process. The main tools are the use of group actions to analyze overparametrization and the use of Riemannian submersion from the space of parameters to the space of observables. The foliation of the balanced manifold in the parameter space by group orbits is used to define and compute a Boltzmann entropy. We also show that the Riemannian geometry on the space of obse...
ID: 2509.09088v1 cs.LG, math.DG, math.DS