📊 Статистика дайджестов
Всего дайджестов: 34022 Добавлено сегодня: 82
Последнее обновление: сегодня
📄 Norm-Q: Effective Compression Method for Hidden Markov Models in Neuro-Symbolic Applications
2025-10-03Авторы:
Hanyuan Gao, Xiaoxuan Yang
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Hidden Markov models (HMM) are commonly used in generation tasks and have
demonstrated strong capabilities in neuro-symbolic applications for the Markov
property. These applications leverage the strengths of neural networks and
symbolic reasoning to create robust and interpretable AI systems. However, they
may inherit and amplify the shortcomings of both approaches. Both components
require dense computation and data transfer, and their communication further
hinders performance. This paper propos...
📄 Who invented deep residual learning?
2025-10-01Авторы:
Juergen Schmidhuber
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Modern AI is based on deep artificial neural networks (NNs). As of 2025, the
most cited scientific article of the 21st century is an NN paper on deep
residual learning with residual connections. Who invented this? We present a
timeline of the evolution of deep residual learning.
Авторы:
Lucio La Cava, Andrea Tagarelli
## Контекст
Одна из основных проблем с Large Language Models (LLMs) заключается в том, чтобы выравнять их беспристрастную продуктивность с целями и предпочтениями пользователей. Несмотря на то, что существуют методы, такие как Reinforcement Learning from Human Feedback (RLHF) и Direct Preference Optimization (DPO), эти подходы требуют больших объемов данных, дорогостоящей оптимизации и постоянной адаптации модели к конкретным задачам. Это приводит к значительным затратам времени и ресурсов. Для решения этой проблемы необходимо разработать метод, который бы становился более эффективным, гибким и менее дешевле, не требовал бы огромных вычислительных мощностей и мог бы использоваться в разных сценариях применения.
## Метод
Метод, предложенный в работе, называется **Preference alignment of Large Language Models via Residual Steering (PaLRS)**, и является тренировочно-свободным подходом. Он использует "резидуальные потоки" (residual streams), отражающие динамику нелинейных связей в модели, для извлечения легких в использовании векторов управления. Такие векторы могут быть применены во время инференса, чтобы направить модель на поведение, соответствующее предпочтениям пользователя. Метод требует сравнительно малого количества примеров (например, одного из сто до пользовательских предпочтений) для создания этих векторов управления. Это позволяет подстраивать модель под задачи и пользовательские требования без необходимости снова тренировать модель, а также обеспечивает высокую эффективность и гибкость.
## Результаты
Авторы проверили PaLRS на различных опен-сорсных LLMs, включая модели малого и среднего масштаба. На бенчмарк-задачах, таких как математическое разумание и генерация кода, модели с PaLRS-встраиваемыми векторами управления показали значительные улучшения в производительности. Эти модели сохранили свои общие качественные показатели, такие как гибкость и базовые функциональные возможности, не потеряв в общей точности и галости. Кроме того, PaLRS показала значительные экономии времени и ресурсов по сравнению с Direct Preference Optimization (DPO), в то же время оставаясь более эффективной и перспективной альтернативой.
## Значимость
Предлагаемый подход имеет широкие применения в области адаптации LLMs к пользовательским предпочтениям. Он может использоваться в сферах, где требуется высокая гибкость и эффективность в настройке моделей на особые задачи (например, генерация кода, медицинские задачи, специализированные задачи технического письма). Одним из преимуществ PaLRS является его тренировочно-свободный характер, который позволяет избежать времязатратных и ресурсоемких процессов оптимизации. Благодаря этому, PaLRS может быть широко использован в сценариях, где не
Annotation:
Preference alignment is a critical step in making Large Language Models
(LLMs) useful and aligned with (human) preferences. Existing approaches such as
Reinforcement Learning from Human Feedback or Direct Preference Optimization
typically require curated data and expensive optimization over billions of
parameters, and eventually lead to persistent task-specific models. In this
work, we introduce Preference alignment of Large Language Models via Residual
Steering (PaLRS), a training-free method t...
Авторы:
Siyuan Guo, Bernhard Schölkopf
## Контекст
Проблема построения эффективных систем обучения широко рассматривается в машинном обучении и теории информации. Основным требованием эффективных систем является минимизация усилий, необходимых для достижения заданного уровня точности. Обучение — это процесс, который, помимо минимизации потерь, должен стремиться к минимизации времени обучения. Несмотря на развитие многих методов обучения, возникает вопрос о том, каким образом эти методы могут быть обобщены и поняты в рамках общей физической модели. Авторы предложили физическую модель, которая позволяет изучать различные схемы обучения в рамках одной концептуальной модели. Модель основывается на механике Лагранжа, которая принята в физике для описания движения и интерпретации динамических систем.
## Метод
Авторы предприняли поиск физической абстракции обучения, приближающей его к модели из физики. Они определили "Learning Lagrangian" (LL) как сумму двух членов: первый — зависит от разности между текущим и желаемым состоянием системы, а второй — от скорости изменения этой разности. Это определение позволяет связать обучение с классическими механическими принципами, такими как принцип меньшего действия. Для различных методов обучения (таких как Gradient Descent, Reinforcement Learning и Generative Models), авторы используют LL для построения аналогов классических методов и разработки новых. Метод предлагает формализовать обучение как проблему минимизации действия в терминах Лагранжа.
## Результаты
Авторы применили LL к построению аналогов классических методов обучения, таких как Gradient Descent и Adam-оптимизатор. На основе LL также построили аналогичный метод для Reinforcement Learning, основываясь на Bellman's optimality equation. Они показали, что методы, построенные на LL, демонстрируют более эффективное обучение, достигающее желаемого уровня точности с меньшим числом итераций. Эксперименты проводились на синтетических и реальных данных, показывая, что LL-основные методы существенно сокращают время обучения.
## Значимость
Предлагаемая модель имеет широкие применения в различных областях машинного обучения, в том числе в решении задач регрессии, классификации и обучения с подкреплением. Авторы показали, что их подход может быть применен к широкому кругу задач, включая обучение генеративных моделей. Модель не только позволяет оптимизировать существующие методы, но также открывает новые возможности для создания более эффективных систем обучения. Благодаря новому подходу, модель может стать основой для будущих исследований в области физических абстракций машинного обучения.
## Выводы
Авторы предложили новую физическую абстракцию для обу
Annotation:
We study the problem of building an efficient learning system. Efficient
learning processes information in the least time, i.e., building a system that
reaches a desired error threshold with the least number of observations.
Building upon least action principles from physics, we derive classic learning
algorithms, Bellman's optimality equation in reinforcement learning, and the
Adam optimizer in generative models from first principles, i.e., the Learning
$\textit{Lagrangian}$. We postulate that ...
Авторы:
Arna Ghosh, Zahraa Chorghay, Shahab Bakhtiari, Blake A. Richards
## Контекст
В области исследований по строению и функционированию человеческого зрения существует много вопросов относительно того, как зрительные системы эффективно и надежно представляют входные данные. Одна из ключевых проблем заключается в том, чтобы достичь оптимального баланса между эффективностью и устойчивостью представлений. Этот вопрос является относительно сложным из-за того, что структура визуального мозга имеет значительную гибкость и может отличаться в различных регионах в зависимости от конкретных задач. В этой статье рассматривается эта проблема с помощью анализа представлений в зрительном мозге человека и искусственных нейронных сетей (ANN) с использованием популяционной геометрии.
## Метод
Методология исследования основывается на использовании различных методов анализа представлений в зрительных регионах мозга человека и искусственных нейронных сетей. Основным подходом является использование размерности геометрических представлений в разных уровнях вертикальной цепи зрения. Были проанализированы различные регионы мозга, включая низкоуровневые и высокоуровневые, а также искусственные нейронные сети, обученные с помощью самостоятельного обучения. Была также применена методика, позволяющая определять, насколько представления являются "scale-free" или имеют другую структуру, что позволяет понять, насколько эффективными и устойчивыми системы зрения.
## Результаты
Результаты исследования показали, что в зрительной системе человека в большинстве регионов зрения представления имеют "scale-free" геометрию, то есть их диапазон влияния зависит от масштаба, что позволяет эффективно отображать входные данные и устойчивость к шумам. Однако в каком-то конкретном регионе зрительного мозга это не так. В этом регионе представление имело другую структуру, которая не является "scale-free". Таким образом, исследование показало, что "scale-free" геометрия не является обязательным условием для представлений во всех регионах визуального мозга. Также было обнаружено, что искусственные нейронные сети, обученные с помощью самостоятельного обучения, также могут иметь "scale-free" геометрию, но она исчезает после того, как сеть начинает обучаться на конкретной задаче.
## Значимость
Эти находки имеют большое значение для понимания того, как различные уровни визуальной системы обрабатывают информацию. Они показывают, что "scale-free" геометрия не является обязательным условием во всех регионах зрительной системы, а зависит от конкретной задачи и целей системы. В частности, это может быть применено в технологиях, включая робототехни
Annotation:
Biological and artificial intelligence systems navigate the fundamental
efficiency-robustness tradeoff for optimal encoding, i.e., they must
efficiently encode numerous attributes of the input space while also being
robust to noise. This challenge is particularly evident in hierarchical
processing systems like the human brain. With a view towards understanding how
systems navigate the efficiency-robustness tradeoff, we turned to a population
geometry framework for analyzing representations in th...
📄 Circuit realization and hardware linearization of monotone operator equilibrium networks
2025-09-19Авторы:
Thomas Chaffey
#### Контекст
Область исследования сосредоточена на связи между поведением резисторно-диодных сетей и решениями нейронных сетей с бесконечной глубиной, основанными на функции ReLU. Эта связь доказывает, что поведение таких сетей может быть эффективно реализовано в аналоговой аппаратуре. Мотивация заключается в развитии более эффективных алгоритмов и аппаратных решений для обучения нейронных сетей непосредственно в аппаратном уровне, что позволяет устранить некоторые ограничения существующих методов.
#### Метод
Методология основывается на построении аппаратной реализации резисторно-диодных сетей, которая эмулирует решение монотонного оператора сети ReLU. Основная техническая мантия заключается в использовании техники "hardware linearization", позволяющей вычислять производные непосредственно в аппаратном уровне. Это позволяет обучать нейросети непосредственно в аппаратном уровне. Методика расширяется на случаи каскадных сетей, которые могут эмулировать более сложные структуры, такие как feedforward. Добавлено рассмотрение различных нелинейных элементов, в частности, появление новой диодной функции ReLU, основанной на модели неидеального диода.
#### Результаты
В результате экспериментов показано, что резисторно-диодные сети могут значительно сократить ресурсы и скорость обучения, так как обучение происходит непосредственно в аппаратном уровне, без необходимости перевода на программный. Использовались симуляционные модели аппаратных сетей, демонстрирующие возможность обучения нейронных сетей непосредственно в аппаратном уровне. Также были получены результаты, показывающие, что различные нелинейные элементы влияют на форму функции активации, что открывает новые возможности для развития моделей нейронных сетей.
#### Значимость
Это исследование имеет широкие области применения, в том числе в обучении нейронных сетей, распознавании образов, искусственном интеллекте и других задачах машинного обучения. Основное преимущество заключается в улучшении производительности и эффективности обучения нейронных сетей, устранении необходимости в переводе аппаратных моделей на программный уровень. Это может привести к значительному сокращению времени обучения и энергозатрат.
#### Выводы
Основными достижениями является доказательство возможности реализации моделей нейронных сетей непосредственно в аппаратном уровне с помощью резисторно-диодных сетей. Была введена новая, более эффективная методика, позволяющая обучать модели непосредственно в аппаратном уровне. В будущем планируется расширить исследования на более сложные структуры нейронных сетей, такие как рекуррентные сети
Annotation:
It is shown that the port behavior of a resistor-diode network corresponds to
the solution of a ReLU monotone operator equilibrium network (a neural network
in the limit of infinite depth), giving a parsimonious construction of a neural
network in analog hardware. We furthermore show that the gradient of such a
circuit can be computed directly in hardware, using a procedure we call
hardware linearization. This allows the network to be trained in hardware,
which we demonstrate with a device-level...
📄 Traces Propagation: Memory-Efficient and Scalable Forward-Only Learning in Spiking Neural Networks
2025-09-18Авторы:
Lorenzo Pes, Bojian Yin, Sander Stuijk, Federico Corradi
## Контекст
Spiking Neural Networks (SNNs) представляют собой мощный подход к обработке динамических сигналов с пространственно-временной структурой, а также к исследованию принципов обучения, основанных на биологических нейронных системах. Однако, обучение SNNs столкнулось с значительными трудностями, в частности, с задачей кредитного назначения в пространстве и времени. Наиболее распространенным подходом является Backpropagation Through Time (BPTT) со суррогатными градиентами. Однако, BPTT значительно отходит от принципов биологической нейроники, в которых существуют локальные связи между слоями и временными потоками сигналов. Это приводит к высоким требованиям к вычислительным ресурсам и памяти, что ограничивает возможности эффективной обучаемости и возможности использования SNN в устройствах на устье.
## Метод
Мы предлагаем Traces Propagation (TP) — новый подход, основанный на полностью локальной методике обучения, который использует элигибильностные следы для решения проблем кредитного назначения во времени и в пространстве. Технически, TP является forward-only и полностью локальным, не требуя дополнительных матриц для слоёв, что позволяет эффективно масштабироваться. Наш метод объединяет элигибильностные следы с контрастным потери для решения проблемы пространственного кредитного назначения. Эта методика позволяет достичь высокой эффективности и масштабируемости при применении к научным и практическим задачам.
## Результаты
Мы проводили эксперименты с использованием таких данных, как NMNIST, SHD, DVS-GESTURE и DVS-CIFAR10. Наше решение показало высокую эффективность на NMNIST и SHD, демонстрируя значительное превосходство над другими полностью локальными методами. На более сложных датасетах, таких как DVS-GESTURE и DVS-CIFAR10, TP показало конкурентную производительность, даже при масштабировании к глубинным архитектурам SNN, таким как VGG-9. Мы также продемонстрировали мощь TP в практических задачах, таких как классификация слов в Google Speech Commands, что демонстрирует возможность TP для эффективного обучения на мелких устройствах.
## Значимость
Решение TP имеет широкие перспективы применения в сферах, где требуется эффективная обработка динамичных сигналов в реальном времени, таких как распознавание голоса, обработка сигналов сенсоров и обучение на устье. TP отличается своим высоким масштабируемым потенциалом и низкими требованиями к памяти, что делает его привлекательным для использования в устройствах углублённого обучения. Он позволяет решать задачи, где предыдущие подходы, включая BPTT, были неэффективны.
## Выводы
Мы представили Traces Propagation — новый метод, который доби
Annotation:
Spiking Neural Networks (SNNs) provide an efficient framework for processing
dynamic spatio-temporal signals and for investigating the learning principles
underlying biological neural systems. A key challenge in training SNNs is to
solve both spatial and temporal credit assignment. The dominant approach for
training SNNs is Backpropagation Through Time (BPTT) with surrogate gradients.
However, BPTT is in stark contrast with the spatial and temporal locality
observed in biological neural systems ...
Авторы:
Hritik Arasu, Faisal R Jahangiri
## Контекст
Мускульные, зрительные, электродные, чищечные и шейные артефакты в электроэнцефалограммах (EEG) часто портят автоматизированные анализы, но их выявление и масштабная лейблирование оказываются дорогостоящими. Исследователи изучают возможности современных генеративных моделей для синтеза реалистичных, лейблированных артефактных сегментов, которые могли бы использоваться для дополнения тренировочных наборов данных и повышения устойчивости алгоритмов к различным условиям.
## Метод
Для сравнения двух генеративных моделей — протекторного WGAN-GP с проекционным дискриминатором и 1D-деноизинговой диффузионной модели с классификаторно-свободной наклоном — было применено Тюфский корпус EEG-артефактов (TUH EEG Artifact, TUAR). Данные были разбиты на субъектно-специфические подвыборки, а окна фиксированной длины (например, 250 отсчетов) были предварительно обработаны для каждой модели: минимум-макс для WGAN-GP и з-скор по каждому каналу/записи для диффузии.
## Результаты
Сравнение проводилось по трем направлениям: (i) характеристика реалистичности с помощью изменений Welch-банд-пода и других метрик (многомерное мерное отличие, автокорреляция, Frobenius-дистанция), (ii) специфичности с помощью легких $k$NN и методов классификации, (iii) ценности с использованием эффектов на артефактном распознавании. Обе модели показали слабую класс-устойчивую восстановление, но WGAN-GP демонстрировал лучший спектральный аналог реальных данных по метрикам типа MMD.
## Значимость
Полученные модели могут применяться в сферах здравоохранения, автоматизации сенсорных систем, в том числе для расширения наборов данных в области обучения с доступом к лейблированным артефактам. Основное преимущество — возможность создания реалистичных артефактов с учетом классов, что дает возможность улучшить устойчивость алгоритмов к различным условиям.
## Выводы
Сравнение WGAN-GP и диффузионной модели показало, что WGAN-GP даёт более точный спектральный аналог реальных артефактов, но обе модели слабо выполняют класс-устойчивое восстановление. Дальнейшие исследования должны сфокусироваться на улучшении условности моделей и расширении объёма синтезируемых данных.
Annotation:
Artifacts in electroencephalography (EEG) -- muscle, eye movement, electrode,
chewing, and shiver -- confound automated analysis yet are costly to label at
scale. We study whether modern generative models can synthesize realistic,
label-aware artifact segments suitable for augmentation and stress-testing.
Using the TUH EEG Artifact (TUAR) corpus, we curate subject-wise splits and
fixed-length multi-channel windows (e.g., 250 samples) with preprocessing
tailored to each model (per-window min-max ...
Авторы:
Marcos Eduardo Valle, Santiago Velasco-Forero, Joao Batista Florindo, Gustavo Jesus Angulo
## Контекст
Mathematical morphology (MM) является мощным нелинейным подходом к обработке изображений и пространственных данных. Он найден применение в различных областях, включая выделение объектов, сегментацию изображений, и текстовый анализ. Хотя MM был успешно применен к изображениям с одним каналом, таким как градации серого, его распространение на вектор-значные изображения, такие как цветные и гиперспектральные изображения, еще не достигло оптимальности. Одна из проблем в этой области является выбор подходящего векторного порядка для построения морфологических операторов. Несмотря на несколько предложенных подходов, нет единого мнения о наиболее эффективном методе. Этот труд ориентируется на разработку метода, приближающего функционально Condorcet ranking, который может стать ключевым для построения эффективных морфологических операторов для вектор-значных изображений.
## Метод
Предлагаемый подход основывается на машинном обучении для обучения уменьшенного порядка, приближающего Condorcet ranking. В этой модели, векторные порядки представляются как голосующие элементы, которые выбирают оптимальные морфологические операторы. Используя многоканальные изображения, мы строим векторные порядки для каждого канала и объединяем их в множество векторных порядков. Затем, мы обучаем модель машинного обучения для извлечения уменьшенного порядка, который будет интерпретировать Condorcet ranking. Эта модель использует нейронные сети с конкретной архитектурой, чтобы оптимизировать порядок векторов и получить наилучший приближенный Condorcet ranking.
## Результаты
Мы проводили эксперименты с различными наборами цветных и гиперспектральных изображений. Данные были разделены на обучающую и тестовую выборки. Мы сравнили результаты нашей модели с другими методами, такими как топологический подход и методы группового порядка. Наши результаты показали, что уменьшенный порядок, извлеченный нашей моделью, приближается к Condorcet ranking более эффективно, чем предыдущие подходы. Мы также измерили метрики точности и скорости обучения, показав, что наш подход существенно сокращает время обучения и повышает точность распознавания.
## Значимость
Наш подход имеет значительное значение в области computer vision и image processing. Он может быть применен для построения эффективных морфологических операторов для работы с цветными и гиперспектральными изображениями. Кроме того, Condorcet ranking может быть применен в других областях, таких как текстовый анализ и data mining, где требуется выделение ключевых элементов в наборе данных. Этот подход также может способствовать развитию машинного обучения в области spatial data analysis.
## Выводы
Мы разработали метод, приближающий Condorc
Annotation:
Mathematical morphology provides a nonlinear framework for image and spatial
data processing and analysis. Although there have been many successful
applications of mathematical morphology to vector-valued images, such as color
and hyperspectral images, there is still no consensus on the most suitable
vector ordering for constructing morphological operators. This paper addresses
this issue by examining a reduced ordering approximating the Condorcet ranking
derived from a set of vector orderings. ...
Авторы:
Yuhan Helena Liu, Victor Geadah, Jonathan Pillow
## Контекст
Изучение как животные учатся, является центральной проблемой в нейронауках, особенно в связи с развитием животных-или человеческих-алгоритмов искусственного интеллекта. Однако многие существующие подходы предполагают определенные параметрические модели для нормализации норм обучения (например, Q-learning, policy gradient) или ограничены в простых задачах, таких как bandit tasks, которые не включают в себя научение новых ввода-вывода совершенно с нуля. Несмотря на это, животные часто должны научиться новым поведениям с нуля, что представляет богатый вызов для науки о познании. Мы стремимся к решению этой проблемы, предлагая фундаментальный подход к оценке норм обучения непосредственно из данных поведения животных в ходе их обучения, что требует моделей норм обучения, достаточно гибких для внедрения субоптимальности, зависимости от истории и разнообразия внешних стимулов без внедрения строгих моделей.
## Метод
Мы предлагаем два модели для оценки норм обучения. Первый - непараметрический, основывается на глубокой нейронной сети (DNN), которая параметризирует подпроцессы норм обучения в каждом эксперименте. Эта модель позволяет представить подвижность и интеграцию внешних стимулов, а также учитывать субоптимальность. Второй модель - рекуррентный (RNN), который добавляет возможность зависимости обновлений норм обучения от истории попыток. Мы проводим эмпирическую валидацию в симуляционных условиях, показывая, что модели могут восстановить значения норм обучения, которые являются знаковыми.
## Результаты
Мы применяем нашу модель к реальным данным из исследований мышей, научающихся выполнять задачи сенсорного принятия решений в течение нескольких недель. Наши модели предсказывали поведение на новых данных, которые не были использованы во время обучения. Оцененные нормы обучения показали асимметричность в обновлениях после удачных и неудачных попыток, а также зависимость от истории попыток, согласующуюся с моделью не-марковского обучения.
## Значимость
Мы предлагаем гибкий фреймворк для оценки норм обучения, который может быть использован в различных научных и прикладных задачах. Наши результаты могут информировать обучение животных в экспериментах, а также помочь в развитии цифровых двойников поведения для моделирования и исследования. Мы также открываем возможности для более детального понимания мозговых механизмов обучения.
## Выводы
Мы представили новую модель для оценки норм обучения, которая может применяться к данным о поведении в ходе де-ново обучения. Наши результаты не только улучшают моделирование поведения, но и открывают пути для повышения
Annotation:
Understanding how animals learn is a central challenge in neuroscience, with
growing relevance to the development of animal- or human-aligned artificial
intelligence. However, most existing approaches assume specific parametric
forms for the learning rule (e.g., Q-learning, policy gradient) or are limited
to simplified settings like bandit tasks, which do not involve learning a new
input-output mapping from scratch. In contrast, animals must often learn new
behaviors de novo, which poses a rich ...
Показано 51 -
60
из 74 записей