📊 Статистика дайджестов
Всего дайджестов: 34022 Добавлено сегодня: 82
Последнее обновление: сегодня
Авторы:
Adri Gómez Martín, Felix Möller, Steven McDonagh, Monica Abella, Manuel Desco, Elliot J. Crowley, Aaron Klein, Linus Ericsson
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Neural architecture search (NAS) in expressive search spaces is a computationally hard problem, but it also holds the potential to automatically discover completely novel and performant architectures. To achieve this we need effective search algorithms that can identify powerful components and reuse them in new candidate architectures. In this paper, we introduce two adapted variants of the Smith-Waterman algorithm for local sequence alignment and use them to compute the edit distance in a gramm...
Авторы:
Brennen A. Hill
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Traditional neural networks, while powerful, rely on biologically implausible
learning mechanisms such as global backpropagation. This paper introduces the
Structurally Adaptive Predictive Inference Network (SAPIN), a novel
computational model inspired by the principles of active inference and the
morphological plasticity observed in biological neural cultures. SAPIN operates
on a 2D grid where processing units, or cells, learn by minimizing local
prediction errors. The model features two primar...
Авторы:
Siddharth Chaudhary
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Large language models display in-context learning as an emergent effect of
scale, but they rely on static weights during inference. In contrast,
biological systems continually adapt via synaptic plasticity. We investigate
whether explicit, biologically inspired plasticity can endow Transformers with
faster in-sequence adaptation. To this end, we augment decoder-only
Transformers with fast-weight modules updated either by (i) a neuromodulated
Hebbian rule or (ii) the gradient-based plasticity mec...
Авторы:
Haiyang Li, Liao Yu, Qiang Yu, Yunliang Zang
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Biological circuits have evolved to incorporate multiple modules that perform
similar functions. In the fly olfactory circuit, both lateral inhibition (LI)
and neuronal spike frequency adaptation (SFA) are thought to enhance pattern
separation for odor learning. However, it remains unclear whether these
mechanisms play redundant or distinct roles in this process. In this study, we
present a computational model of the fly olfactory circuit to investigate odor
discrimination under varying noise co...
Авторы:
Michael James McCulloch
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
The Free Energy Principle (FEP) states that self-organizing systems must
minimize variational free energy to persist, but the path from principle to
implementable algorithm has remained unclear. We present a constructive proof
that the FEP can be realized through exact local credit assignment. The system
decomposes gradient computation hierarchically: spatial credit via feedback
alignment, temporal credit via eligibility traces, and structural credit via a
Trophic Field Map (TFM) that estimates ...
Авторы:
Charalampos Lamprou, Aamna Alshehhi, Leontios J. Hadjileontiadis, Mohamed L. Seghier
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Accounting for inter-individual variability in brain function is key to
precision medicine. Here, by considering functional inter-individual
variability as meaningful data rather than noise, we introduce VarCoNet, an
enhanced self-supervised framework for robust functional connectome (FC)
extraction from resting-state fMRI (rs-fMRI) data. VarCoNet employs
self-supervised contrastive learning to exploit inherent functional
inter-individual variability, serving as a brain function encoder that
gen...
Авторы:
Charalampos Lamprou, Aamna Alshehhi, Leontios J. Hadjileontiadis, Mohamed L. Seghier
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Accounting for inter-individual variability in brain function is key to
precision medicine. Here, by considering functional inter-individual
variability as meaningful data rather than noise, we introduce VarCoNet, an
enhanced self-supervised framework for robust functional connectome (FC)
extraction from resting-state fMRI (rs-fMRI) data. VarCoNet employs
self-supervised contrastive learning to exploit inherent functional
inter-individual variability, serving as a brain function encoder that
gen...
Авторы:
Adrian Kosowski, Przemysław Uznański, Jan Chorowski, Zuzanna Stamirowska, Michał Bartoszkiewicz
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
The relationship between computing systems and the brain has served as
motivation for pioneering theoreticians since John von Neumann and Alan Turing.
Uniform, scale-free biological networks, such as the brain, have powerful
properties, including generalizing over time, which is the main barrier for
Machine Learning on the path to Universal Reasoning Models.
We introduce `Dragon Hatchling' (BDH), a new Large Language Model
architecture based on a scale-free biologically inspired network of \$n...
Авторы:
Alastair Poole, Stig McArthur, Saravan Kumar
## Контекст
Проблема исследования заключается в ограниченной точности и понимаемости моделей машинного обучения в области сложных задач, таких как синтез машин, обработка сигналов и другие специализированные приложения. Особенностью существующих методов является их неэффективность в условиях высокой размерности параметров, что приводит к переобучению и снижению общей устойчивости. Одна из причин этому является "непривязанная" многомерная сплайн-пространственная модель, которая недостаточно сжата и неэффективна в отношении вывода значимых характеристик. Мотивация заключается в развитии методов, которые могут сжимать пространство параметров с минимальными потерями точности и обеспечивать интерпретируемый вывод.
## Метод
Методология основывается на развитии Projective Kolmogorov-Arnold Networks (P-KANs), новаторного подхода к аппроксимации функций, в котором поиск интерпретируемых решений проводится с помощью минимизации энтропии пространства проекций. Функции представлены на основе сплайнов, при этом используется спектральное разложение (Fourier, Chebyshev, Bessel) для сжатия параметров. Архитектура P-KANs включает в себя специальное сжатие "непривязанного" пространства в узлах сети, чтобы нейронная сеть могла эффективно работать с представлениями, оптимальными для задачи. Эта техника основывается на анализе пространств проекций и градиентных методах, чтобы оптимизировать поведение модели в зоне минимума вариации.
## Результаты
Эксперименты были проведены на различных наборах данных, включая индустриальные задачи, такие как предсказание процессов автоматизированного волоконного размещения (Automated Fiber Placement, AFP). Показано, что P-KANs обеспечивают до 80% сокращения параметров, сохраняя высокую точность решения. Модель показала существенное сокращение в спектре ошибок, особенно в условиях шума. На основе этих результатов, модель продемонстрировала улучшенную устойчивость и интерпретируемость, что является ключевым преимуществом для применения в научных и промышленных приложениях.
## Значимость
Полученные результаты открывают новые перспективы для интерпретируемого машинного обучения в области сложных задач. P-KANs могут применяться в различных сферах, включая динамическую оптимизацию процессов, моделирование физических процессов и информационные системы. Основное преимущество заключается в сжатии пространства параметров и обеспечении точности, что позволяет использовать модель в реальных условиях. Будущие исследования будут направлены на улучшение методов сжатия, а также на расширение возможностей P-KANs в области сложных нелинейных задач.
## Выво
Annotation:
Kolmogorov-Arnold Networks (KANs) relocate learnable nonlinearities from
nodes to edges, demonstrating remarkable capabilities in scientific machine
learning and interpretable modeling. However, current KAN implementations
suffer from fundamental inefficiencies due to redundancy in high-dimensional
spline parameter spaces, where numerous distinct parameterisations yield
functionally equivalent behaviors. This redundancy manifests as a "nuisance
space" in the model's Jacobian, leading to suscepti...
📄 Breaking the Conventional Forward-Backward Tie in Neural Networks: Activation Functions
2025-09-11Авторы:
Luigi Troiano, Francesco Gissi, Vincenzo Benedetto, Genny Tortora
#### Контекст
Обучение градиентным сетям обычно подразумевает симметричность между прямой и обратной пропагацией, что приводит к жестким ограничениям на выбор активационных функций. Эти функции должны быть дифференцируемыми (или поддифференцируемыми) и иметь монотонную структуру в определенных регионах, чтобы избежать зон плоских градиентов. Эта симметрия связывает прямую пропагацию с обратной, ограничивая выбор функций, в том числе исключая те, что имеют значительные плоские или недифференцируемые регионы. Наша мотивация заключается в проверке этих ограничений и определении возможности использовать более гибкие модели.
#### Метод
Мы проводим математический анализ и показываем, что необходимость точного управления градиентами может быть заменена строгим направлением грейдента. Далее, мы используем архитектуры, такие как Multi-Layer Perceptrons (MLPs), Convolutional Neural Networks (CNNs) и Binary Neural Networks (BNNs), для проведения экспериментов. Мы заменяем традиционные градиенты на простые или стохастические альтернативы, при этом сохраняя направление градиента. Эти эксперименты позволяют проверить гипотезу о необходимости симметрии в задачах обучения.
#### Результаты
Наши эксперименты показали, что сети с активационными функциями, которые являются недифференцируемыми или имеют значительно плоские регионы, такие как Heaviside step function, могут быть эффективно обучены. Мы заметили, что независимость от традиционных градиентов во время обучения не приводит к ухудшению точности и может даже улучшить стабильность и эффективность обучения.
#### Значимость
Отсутствие симметрии между прямой и обратной пропагацией расширяет гибкость в проектировании нейросетей. Мы показали, что можно применять более простые или недифференцируемые активационные функции, что позволяет экономить ресурсы и улучшать производительность. Это открывает пути к разработке эффективных моделей, которые могут быть применены в сложных задачах, таких как обработка сигналов и рекомендательные системы.
#### Выводы
Мы показали, что необходимость симметрии в обучении нейросетей может быть существенно смягчена. Наши результаты открывают новые возможности для разработки моделей с недифференцируемыми активационными функциями. Будущие исследования будут сфокусированы на расширении этих нахождений к более сложным архитектурам, таким как Transformer-based модели.
Annotation:
Gradient-based neural network training traditionally enforces symmetry
between forward and backward propagation, requiring activation functions to be
differentiable (or sub-differentiable) and strictly monotonic in certain
regions to prevent flat gradient areas. This symmetry, linking forward
activations closely to backward gradients, significantly restricts the
selection of activation functions, particularly excluding those with
substantial flat or non-differentiable regions. In this paper, we ...
Показано 1 -
10
из 15 записей