📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня
Авторы:

Adri Gómez Martín, Felix Möller, Steven McDonagh, Monica Abella, Manuel Desco, Elliot J. Crowley, Aaron Klein, Linus Ericsson

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Neural architecture search (NAS) in expressive search spaces is a computationally hard problem, but it also holds the potential to automatically discover completely novel and performant architectures. To achieve this we need effective search algorithms that can identify powerful components and reuse them in new candidate architectures. In this paper, we introduce two adapted variants of the Smith-Waterman algorithm for local sequence alignment and use them to compute the edit distance in a gramm...
ID: 2512.04992v1 cs.NE, cs.AI, cs.LG
Авторы:

Brennen A. Hill

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Traditional neural networks, while powerful, rely on biologically implausible learning mechanisms such as global backpropagation. This paper introduces the Structurally Adaptive Predictive Inference Network (SAPIN), a novel computational model inspired by the principles of active inference and the morphological plasticity observed in biological neural cultures. SAPIN operates on a 2D grid where processing units, or cells, learn by minimizing local prediction errors. The model features two primar...
ID: 2511.02241v1 cs.NE, cs.AI, cs.LG, q-bio.NC, 68T07, 92B20, I.2.6; I.2.0; I.2.11
Авторы:

Siddharth Chaudhary

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Large language models display in-context learning as an emergent effect of scale, but they rely on static weights during inference. In contrast, biological systems continually adapt via synaptic plasticity. We investigate whether explicit, biologically inspired plasticity can endow Transformers with faster in-sequence adaptation. To this end, we augment decoder-only Transformers with fast-weight modules updated either by (i) a neuromodulated Hebbian rule or (ii) the gradient-based plasticity mec...
ID: 2510.21908v1 cs.NE, cs.AI, cs.LG
Авторы:

Haiyang Li, Liao Yu, Qiang Yu, Yunliang Zang

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Biological circuits have evolved to incorporate multiple modules that perform similar functions. In the fly olfactory circuit, both lateral inhibition (LI) and neuronal spike frequency adaptation (SFA) are thought to enhance pattern separation for odor learning. However, it remains unclear whether these mechanisms play redundant or distinct roles in this process. In this study, we present a computational model of the fly olfactory circuit to investigate odor discrimination under varying noise co...
ID: 2510.21315v1 cs.NE, cs.AI, cs.LG
Авторы:

Michael James McCulloch

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
The Free Energy Principle (FEP) states that self-organizing systems must minimize variational free energy to persist, but the path from principle to implementable algorithm has remained unclear. We present a constructive proof that the FEP can be realized through exact local credit assignment. The system decomposes gradient computation hierarchically: spatial credit via feedback alignment, temporal credit via eligibility traces, and structural credit via a Trophic Field Map (TFM) that estimates ...
ID: 2510.17916v1 cs.NE, cs.AI, cs.LG, q-bio.NC
Авторы:

Charalampos Lamprou, Aamna Alshehhi, Leontios J. Hadjileontiadis, Mohamed L. Seghier

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Accounting for inter-individual variability in brain function is key to precision medicine. Here, by considering functional inter-individual variability as meaningful data rather than noise, we introduce VarCoNet, an enhanced self-supervised framework for robust functional connectome (FC) extraction from resting-state fMRI (rs-fMRI) data. VarCoNet employs self-supervised contrastive learning to exploit inherent functional inter-individual variability, serving as a brain function encoder that gen...
ID: 2510.02120v2 cs.NE, cs.AI, cs.LG, q-bio.NC
Авторы:

Charalampos Lamprou, Aamna Alshehhi, Leontios J. Hadjileontiadis, Mohamed L. Seghier

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Accounting for inter-individual variability in brain function is key to precision medicine. Here, by considering functional inter-individual variability as meaningful data rather than noise, we introduce VarCoNet, an enhanced self-supervised framework for robust functional connectome (FC) extraction from resting-state fMRI (rs-fMRI) data. VarCoNet employs self-supervised contrastive learning to exploit inherent functional inter-individual variability, serving as a brain function encoder that gen...
ID: 2510.02120v1 cs.NE, cs.AI, cs.LG, q-bio.NC
Авторы:

Adrian Kosowski, Przemysław Uznański, Jan Chorowski, Zuzanna Stamirowska, Michał Bartoszkiewicz

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
The relationship between computing systems and the brain has served as motivation for pioneering theoreticians since John von Neumann and Alan Turing. Uniform, scale-free biological networks, such as the brain, have powerful properties, including generalizing over time, which is the main barrier for Machine Learning on the path to Universal Reasoning Models. We introduce `Dragon Hatchling' (BDH), a new Large Language Model architecture based on a scale-free biologically inspired network of \$n...
ID: 2509.26507v1 cs.NE, cs.AI, cs.LG, stat.ML
Авторы:

Alastair Poole, Stig McArthur, Saravan Kumar

## Контекст Проблема исследования заключается в ограниченной точности и понимаемости моделей машинного обучения в области сложных задач, таких как синтез машин, обработка сигналов и другие специализированные приложения. Особенностью существующих методов является их неэффективность в условиях высокой размерности параметров, что приводит к переобучению и снижению общей устойчивости. Одна из причин этому является "непривязанная" многомерная сплайн-пространственная модель, которая недостаточно сжата и неэффективна в отношении вывода значимых характеристик. Мотивация заключается в развитии методов, которые могут сжимать пространство параметров с минимальными потерями точности и обеспечивать интерпретируемый вывод. ## Метод Методология основывается на развитии Projective Kolmogorov-Arnold Networks (P-KANs), новаторного подхода к аппроксимации функций, в котором поиск интерпретируемых решений проводится с помощью минимизации энтропии пространства проекций. Функции представлены на основе сплайнов, при этом используется спектральное разложение (Fourier, Chebyshev, Bessel) для сжатия параметров. Архитектура P-KANs включает в себя специальное сжатие "непривязанного" пространства в узлах сети, чтобы нейронная сеть могла эффективно работать с представлениями, оптимальными для задачи. Эта техника основывается на анализе пространств проекций и градиентных методах, чтобы оптимизировать поведение модели в зоне минимума вариации. ## Результаты Эксперименты были проведены на различных наборах данных, включая индустриальные задачи, такие как предсказание процессов автоматизированного волоконного размещения (Automated Fiber Placement, AFP). Показано, что P-KANs обеспечивают до 80% сокращения параметров, сохраняя высокую точность решения. Модель показала существенное сокращение в спектре ошибок, особенно в условиях шума. На основе этих результатов, модель продемонстрировала улучшенную устойчивость и интерпретируемость, что является ключевым преимуществом для применения в научных и промышленных приложениях. ## Значимость Полученные результаты открывают новые перспективы для интерпретируемого машинного обучения в области сложных задач. P-KANs могут применяться в различных сферах, включая динамическую оптимизацию процессов, моделирование физических процессов и информационные системы. Основное преимущество заключается в сжатии пространства параметров и обеспечении точности, что позволяет использовать модель в реальных условиях. Будущие исследования будут направлены на улучшение методов сжатия, а также на расширение возможностей P-KANs в области сложных нелинейных задач. ## Выво
Annotation:
Kolmogorov-Arnold Networks (KANs) relocate learnable nonlinearities from nodes to edges, demonstrating remarkable capabilities in scientific machine learning and interpretable modeling. However, current KAN implementations suffer from fundamental inefficiencies due to redundancy in high-dimensional spline parameter spaces, where numerous distinct parameterisations yield functionally equivalent behaviors. This redundancy manifests as a "nuisance space" in the model's Jacobian, leading to suscepti...
ID: 2509.20049v1 cs.NE, cs.AI, cs.LG
Авторы:

Luigi Troiano, Francesco Gissi, Vincenzo Benedetto, Genny Tortora

#### Контекст Обучение градиентным сетям обычно подразумевает симметричность между прямой и обратной пропагацией, что приводит к жестким ограничениям на выбор активационных функций. Эти функции должны быть дифференцируемыми (или поддифференцируемыми) и иметь монотонную структуру в определенных регионах, чтобы избежать зон плоских градиентов. Эта симметрия связывает прямую пропагацию с обратной, ограничивая выбор функций, в том числе исключая те, что имеют значительные плоские или недифференцируемые регионы. Наша мотивация заключается в проверке этих ограничений и определении возможности использовать более гибкие модели. #### Метод Мы проводим математический анализ и показываем, что необходимость точного управления градиентами может быть заменена строгим направлением грейдента. Далее, мы используем архитектуры, такие как Multi-Layer Perceptrons (MLPs), Convolutional Neural Networks (CNNs) и Binary Neural Networks (BNNs), для проведения экспериментов. Мы заменяем традиционные градиенты на простые или стохастические альтернативы, при этом сохраняя направление градиента. Эти эксперименты позволяют проверить гипотезу о необходимости симметрии в задачах обучения. #### Результаты Наши эксперименты показали, что сети с активационными функциями, которые являются недифференцируемыми или имеют значительно плоские регионы, такие как Heaviside step function, могут быть эффективно обучены. Мы заметили, что независимость от традиционных градиентов во время обучения не приводит к ухудшению точности и может даже улучшить стабильность и эффективность обучения. #### Значимость Отсутствие симметрии между прямой и обратной пропагацией расширяет гибкость в проектировании нейросетей. Мы показали, что можно применять более простые или недифференцируемые активационные функции, что позволяет экономить ресурсы и улучшать производительность. Это открывает пути к разработке эффективных моделей, которые могут быть применены в сложных задачах, таких как обработка сигналов и рекомендательные системы. #### Выводы Мы показали, что необходимость симметрии в обучении нейросетей может быть существенно смягчена. Наши результаты открывают новые возможности для разработки моделей с недифференцируемыми активационными функциями. Будущие исследования будут сфокусированы на расширении этих нахождений к более сложным архитектурам, таким как Transformer-based модели.
Annotation:
Gradient-based neural network training traditionally enforces symmetry between forward and backward propagation, requiring activation functions to be differentiable (or sub-differentiable) and strictly monotonic in certain regions to prevent flat gradient areas. This symmetry, linking forward activations closely to backward gradients, significantly restricts the selection of activation functions, particularly excluding those with substantial flat or non-differentiable regions. In this paper, we ...
ID: 2509.07236v1 cs.NE, cs.AI, cs.LG
Показано 1 - 10 из 15 записей