📊 Статистика дайджестов
Всего дайджестов: 34123 Добавлено сегодня: 101
Последнее обновление: сегодня
Авторы:
Arthur Pellegrino, Angus Chadwick
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Analysing how neural networks represent data features in their activations can help interpret how they perform tasks. Hence, a long line of work has focused on mathematically characterising the geometry of such "neural representations." In parallel, machine learning has seen a surge of interest in understanding how dynamical systems perform computations on time-varying input data. Yet, the link between computation-through-dynamics and representational geometry remains poorly understood. Here, we...
Авторы:
Dong Liu
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
We propose Fiber Bundle Networks (FiberNet), a novel machine learning framework integrating differential geometry with machine learning. Unlike traditional deep neural networks relying on black-box function fitting, we reformulate classification as interpretable geometric optimization on fiber bundles, where categories form the base space and wavelet-transformed features lie in the fibers above each category. We introduce two innovations: (1) learnable Riemannian metrics identifying important fr...
Авторы:
Charles Fefferman, Jonathan Marty, Kevin Ren
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
We consider the problem of reconstructing the intrinsic geometry of a manifold from noisy pairwise distance observations. Specifically, let $M$ denote a diameter 1 d-dimensional manifold and $μ$ a probability measure on $M$ that is mutually absolutely continuous with the volume measure. Suppose $X_1,\dots,X_N$ are i.i.d. samples of $μ$ and we observe noisy-distance random variables $d'(X_j, X_k)$ that are related to the true geodesic distances $d(X_j,X_k)$. With mild assumptions on the distribut...
Авторы:
Andrin Rehmann, Nolan Black, Josiah Bjorgaard, Alessandro Angioi, Andrei Paleyes, Niklas Heim, Dion Häfner, Alexander Lavin
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Gradient-based optimization of engineering designs is limited by non-differentiable components in the typical computer-aided engineering (CAE) workflow, which calculates performance metrics from design parameters. While gradient-based methods could provide noticeable speed-ups in high-dimensional design spaces, codes for meshing, physical simulations, and other common components are not differentiable even if the math or physics underneath them is. We propose replacing non-differentiable pipelin...
Авторы:
Willem Diepeveen, Melanie Weber
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
High-dimensional data that exhibit an intrinsic low-dimensional structure are
ubiquitous in machine learning and data science. While various approaches allow
for learning the corresponding data manifold from finite samples, performing
downstream tasks such as optimization directly on these learned manifolds
presents a significant challenge. This work introduces a principled framework
for optimization on learned data manifolds using iso-Riemannian geometry. Our
approach addresses key limitations ...
Авторы:
Amandip Sangha
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
We present a geometric formulation of automatic differentiation (AD) using
jet bundles and Weil algebras. Reverse-mode AD emerges as cotangent-pullback,
while Taylor-mode corresponds to evaluation in a Weil algebra. From these
principles, we derive concise statements on correctness, stability, and
complexity: a functorial identity for reverse-mode, algebraic exactness of
higher-order derivatives, and explicit bounds on truncation error. We further
show that tensorized Weil algebras permit one-pa...
Авторы:
Dhruv Kohli, Sawyer J. Robertson, Gal Mishne, Alexander Cloninger
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Estimating the tangent spaces of a data manifold is a fundamental problem in
data analysis. The standard approach, Local Principal Component Analysis
(LPCA), struggles in high-noise settings due to a critical trade-off in
choosing the neighborhood size. Selecting an optimal size requires prior
knowledge of the geometric and noise characteristics of the data that are often
unavailable. In this paper, we propose a spectral method, Laplacian Eigenvector
Gradient Orthogonalization (LEGO), that utili...
Авторы:
Albert Kjøller Jacobsen, Johanna Marie Gegenfurtner, Georgios Arvanitidis
## Контекст
Область исследования сосредоточена на изучении методов применения геометрически ориентированного шума во время обучения глубоких нейронных сетей. Данный подход направлен на улучшение регуляризации, обеспечения гладкости моделей и улучшения их общей устойчивости и точности. Однако, существующие исследования сфокусированы на добавлении амбиентного шума в входном пространстве, не учитывая особенности низкорангового многообразия, на котором лежит данные. Работа предлагает новые методы геометрически ориентированной инъекции шума, которые учитывают эту структуру. Это необходимо для решения проблем, связанных с высокой кривизной многообразий, на которых обучаются нейронные сети.
## Метод
Метод предлагает добавлять шум в входные данные в том пространстве, которое соответствует низкоранговому многообразию, на котором данные лежат. Это достигается путем проекции гауссовского шума на локальное тангенциальное пространство многообразия. Далее, этот шум маппится на многообразие с помощью геодезической кривой. Также рассматривается шум в виде Броуновского движения, который делает случайные шаги вдоль геодезических кривых. Это позволяет сохранить геометрические особенности многообразия и улучшить генерализацию моделей.
## Результаты
Изучены эффекты разных видов шума на нескольких многообразиях с разной кривизной. Эксперименты показали, что геометрически ориентированный шум существенно улучшает производительность моделей на высококривых многообразиях, увеличивая их общую устойчивость и точность. На простых многообразиях результаты находятся на уровне с обучением без добавления шума. Эксперименты также показали, что шум не влияет на скорость обучения и может быть эффективно применен как на предобработанных, так и на любых других многообразиях, созданных с помощью глубоких нейронных сетей.
## Значимость
Предложенный подход может быть применен в различных областях, где необходимо увеличить устойчивость моделей к выбросам в данных и улучшить их общую производительность на высококривых многообразиях. Он показал преимущество в области обучения с подкреплением, где геометрически ориентированный шум позволил достичь более стабильных и точных результатов. Будущие исследования будут сфокусированы на расширении этого подхода для работы с неоднородными многообразиями и исследовании его применения в мультимодальных задачах обучения.
## Выводы
Результаты показали, что геометрически ориентированный шум значительно улучшает результаты моделей, особенно на высококривых многообраз
Annotation:
It has been shown that perturbing the input during training implicitly
regularises the gradient of the learnt function, leading to smoother models and
enhancing generalisation. However, previous research mostly considered the
addition of ambient noise in the input space, without considering the
underlying structure of the data. In this work, we propose several methods of
adding geometry-aware input noise that accounts for the lower dimensional
manifold the input space inhabits. We start by proje...
Авторы:
Govind Menon, Tianmin Yu
## Контекст
Обучение нейронных сетей с глубокими архитектурами является задачей ключевой во многих областях, включая обработку естественного языка, обработку изображений и распознавание речи. Однако во время обучения моделей наблюдается сильная нестабильность, которая может быть связана с огромным числом параметров и ограниченным количеством данных для обучения. Эта проблема хорошо изучена в линейных нейронных сетях, но менее четко понятна в случае глубоких нейронных сетей. Данное исследование вводит понятие "глубокой линейной сети" (Deep Linear Network, DLN) и исследует её геометрию, чтобы дать фундамент для термодинамического описания обучения нейронных сетей. Основной мотивацией является создание модели, которая может объяснить и упростить понимание процесса обучения в DLN.
## Метод
Исследование основывается на римановой геометрии и групповых действий. Авторы используют подход, основанный на группах, для анализа переобозначения (overparametrization) в DLN. Основной технический шаг — конструкция ортонормированного базиса для тангенсного пространства балансированного многообразия (balanced manifold) с помощью теории Якоби-матриц. Архитектура исследования включает использование Riemannian submersion для перехода от пространства параметров к пространству обобщенных параметров. Модель также использует концепт Больцмановского энтропии, определяемого через листья многообразия в пространстве параметров.
## Результаты
Авторы вводят формулу для Больцмановской энтропии в DLN, которая лежит в основе термодинамической модели обучения. Также они показывают, что Riemannian geometry, определенная на пространстве обобщенных параметров, может быть получена через Riemannian submersion из балансированного многообразия. Экспериментальные результаты показывают, что использование такого подхода позволяет получить более точные прогнозы и улучшить понимание процесса обучения в DLN.
## Значимость
Модель DLN и её геометрия могут быть применены в различных областях, таких как машинное обучение, анализ данных и физическое моделирование. Основное преимущество метода заключается в том, что он обеспечивает новый взгляд на процесс обучения в глубоких нейронных сетях, упрощая понимание и улучшая стабильность. Потенциальное влияние заключается в том, что данный подход может помочь в решении проблемы переобучения и нестабильности в DLN, что в свою очередь может привести к более эффективным моделям и более точным результатам.
## Выводы
В ходе исследования была предложена формула для Больцмановской энтропии в DLN, которая может стать основой для термодинамической модели обучения. Так
Annotation:
We study the Riemannian geometry of the Deep Linear Network (DLN) as a
foundation for a thermodynamic description of the learning process. The main
tools are the use of group actions to analyze overparametrization and the use
of Riemannian submersion from the space of parameters to the space of
observables. The foliation of the balanced manifold in the parameter space by
group orbits is used to define and compute a Boltzmann entropy. We also show
that the Riemannian geometry on the space of obse...