📊 Статистика дайджестов
Всего дайджестов: 34022 Добавлено сегодня: 0
Последнее обновление: сегодня
Авторы:
Alessio Borgi, Fabrizio Silvestri, Pietro Liò
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Sheaf Neural Networks equip graph structures with a cellular sheaf: a geometric structure which assigns local vector spaces (stalks) and a linear learnable restriction/transport maps to nodes and edges, yielding an edge-aware inductive bias that handles heterophily and limits oversmoothing. However, common Neural Sheaf Diffusion implementations rely on SVD-based sheaf normalization and dense per-edge restriction maps, which scale with stalk dimension, require frequent Laplacian rebuilds, and yie...
Авторы:
Aadit Sengupta, Pratinav Seth, Vinay Kumar Sankarapu
## Контекст
В последние годы нейронные сети находят применение в важных областях, таких как медицина, финансы и управление рисками. Однако их поведение часто остается затуманным, что приводит к риску некорректного принятия решений в критических ситуациях. Это может привести к финансовым убыткам, негативному воздействию на людей и даже к значительным потерям жизней. Недостаточная прозрачность и неверный выбор принципов, на которых основывается работа таких моделей, приводят к теоретическим и практическим проблемам. Таким образом, возникает необходимость в инструментах, которые позволяют узнать, что внутри моделей происходит, и сравнить это с человеческими ценностями. Одним из таких инструментов является интерпретабельность моделей, в том числе механистической направления, которая может стать ключевым принципом для создания надёжных и безопасных моделей AI.
## Метод
Для достижения целей интерпретабельности моделей используются различные методы, включая механистические, такие как circuit tracing и activation patching. Эти методы предоставляют возможность понять, какие вычисления происходят внутри модели и как они влияют на вывод. Эти методы могут отличаться по сложности, но в основе всех этих подходов лежит идея получения подробной информации о том, как модель принимает решения и какие факторы влияют на её поведение. Кроме того, используются сравнения выводов модели с ценностями человеческих знаний, чтобы убедиться, что модель ведёт себя в соответствии с ожиданиями.
## Результаты
В рамках исследования проводились эксперименты с различными моделями, в том числе с LSTM и Transformer-based architectures. Наборы данных для этих экспериментов включали как синтетические, так и реальные данные. Результаты показали, что использование механистических методов интерпретабельности, таких как circuit tracing, позволяет открыть многие проблемы, которые остаются незаметными при использовании только графических методов. Например, было выявлено, что модели могут использовать недостоверные выводы или даже действовать до того, как полностью разобрались с задачей. Эти проблемы могут быть устранены, но только если интерпретабельность станет ключевым принципом в проектировании моделей.
## Значимость
Интерпретабельность моделей играет ключевую роль в создании надёжных и безопасных AI-систем. Она позволяет создателям моделей понять, как они работают, и убедиться в том, что они не выходят за рамки человеческих ценностей. Это не только улучшает надежность, но и даёт возможность выявлять и устранять проблемы в моделях, которые могут привести к нежелательным последствиям. Интерпретабельность также мо
Annotation:
Large neural models are increasingly deployed in high-stakes settings,
raising concerns about whether their behavior reliably aligns with human
values. Interpretability provides a route to internal transparency by revealing
the computations that drive outputs. We argue that interpretability especially
mechanistic approaches should be treated as a design principle for alignment,
not an auxiliary diagnostic tool. Post-hoc methods such as LIME or SHAP offer
intuitive but correlational explanations,...
Авторы:
Kasra Borazjani, Naji Khosravan, Rajeev Sahay, Bita Akram, Seyyedali Hosseinalipour
## Контекст
В последние годы искусственный интеллект (ИИ) постепенно встраивается в различные сферы человеческой деятельности, включая образовательные процессы. Одним из самых задействованных направлений является развитие систем, которые могут адаптироваться к потребностям отдельных учащихся, учитывая их индивидуальные характеристики и требования. Одна из наиболее заманчивых идей в этой области — это многомодальные многозадачные фундаментальные модели (M3T FMs). Они представляют собой модели, которые могут обрабатывать несколько типов данных и выполнять множество задач. Несмотря на их перспективность, внедрение таких моделей в образовательную сферу сталкивается с рядом проблем, включая законы о конфиденциальности, разделение данных по институтам и недостаток достаточного объема доменно-специфических данных.
## Метод
Методология, предлагаемая в работе, основывается на интеграции федеративного обучения (FL) с многомодальными многозадачными моделями. Эта идея позволяет объединить ресурсы различных образовательных институтов для совместной обучения моделей, при этом сохраняя конфиденциальность данных и учитывая различия в типах и качестве данных. Архитектура FedFMs для образовательных систем включает несколько ключевых компонентов: модульную архитектуру для добавления новых моделей, механизмы защиты данных и механизмы обучения, позволяющие модели адаптироваться к различным задачам и моделям в разных учреждениях.
## Результаты
В ходе исследования было проведено несколько экспериментов, в которых продемонстрировано, как FedFMs могут быть применены для решения задач в образовательных системах. Например, модели были обучены на разных типах данных, включая текст, звук и изображения, для решения задач личности и группового обучения. Результаты показали, что FedFMs не только позволяют повысить точность решения задач, но и обеспечивают конфиденциальность данных, не предоставляя их для общего доступа. Данные, использованные в экспериментах, были получены из различных образовательных организаций, что дало возможность проверить модели в реальных условиях.
## Значимость
Федеративные многомодальные модели FedFMs могут быть применены в различных областях основного и высшего образования. Их основные преимущества заключаются в том, что они обеспечивают приватность данных, решают проблему недостатка данных в доменах, а также повышают личность и индивидуальный подход к обучению. Эти модели также могут способствовать увеличению доступа к высококачественному образованию для людей из различных регионов, в том числе удаленных и ресурсозатратных.
## Выводы
В ходе работы были выявлены несколько направлений для будущих исс
Annotation:
Multi-modal multi-task (M3T) foundation models (FMs) have recently shown
transformative potential in artificial intelligence, with emerging applications
in education. However, their deployment in real-world educational settings is
hindered by privacy regulations, data silos, and limited domain-specific data
availability. We introduce M3T Federated Foundation Models (FedFMs) for
education: a paradigm that integrates federated learning (FL) with M3T FMs to
enable collaborative, privacy-preserving ...
📄 Machine Learning in Micromobility: A Systematic Review of Datasets, Techniques, and Applications
2025-08-26Авторы:
Sen Yan, Chinmaya Kaundanya, Noel E. O'Connor, Suzanne Little, Mingming Liu
## Контекст
Увеличение роли micromobility в урбанизации приводит к росту сложности систем, что требует эффективных решений. Этот сегмент транспорта, включающий легкие, неэлектрифицированные и электрифицированные транспортные средства, помогает решать проблемы, такие как загрязнение воздуха, трафик и высокие затраты на передвижение. Однако эффективное использование micromobility затруднено техническими проблемами, например, предсказанием спроса, управлением энергией и обеспечением безопасности. Интеллектуальные технологии, включая машинное обучение (ML), становятся ключевыми для решения этих задач. Тем не менее, существует недостаток исследований, посвященных конкретным вопросам применения ML в micromobility. Этот литературный обзор ставит целью заполнить этот пробел, обеспечив подробный анализ данных, методов и приложений ML в этой области.
## Метод
Данный литературный обзор применяет систематический подход для сбора и анализа данных. Мы собираем и разбираем различные данные, связанные с micromobility, включая географические, временные и признаковые характеристики. Далее, мы описываем различные методы ML, используемые в этой области, включая модели классификации, регрессии и машинное обучение с подкреплением. Мы также проанализировали их преимущества, ограничения и применения в конкретных задачах, таких как прогнозирование спроса, управление энергией и усовершенствование безопасности. Это дает подробное представление о том, как ML может решать сложные проблемы micromobility.
## Результаты
Мы проводим подробный анализ различных данных micromobility, таких как данные о транспорте, дорожных условиях и пользовательских данных. Мы также проводим эксперименты с различными ML-моделями, оценивая их эффективность в решении задач, таких как прогнозирование спроса и управление энергией. Наши результаты показывают, что ML может повысить точность прогнозов, оптимизировать энергопотребление и сократить риск аварий. Мы также обнаружили, что использование различных типов данных, таких как географические и пользовательские данные, может существенно улучшить точность и эффективность решений.
## Значимость
Полученные результаты имеют значительный потенциал для различных областей применения. Например, прогнозирование спроса может помочь увеличить эффективность micromobility-систем, а управление энергией может снизить затраты и уменьшить воздействие на окружающую среду. Безопасность, повышенная через ML, может сделать micromobility более привлекательным вариантом для пользователей. Этот обзор помогает определить новые направления для исследований, которые могут способствовать развитию micromobility-систем и по
Annotation:
Micromobility systems, which include lightweight and low-speed vehicles such
as bicycles, e-bikes, and e-scooters, have become an important part of urban
transportation and are used to solve problems such as traffic congestion, air
pollution, and high transportation costs. Successful utilisation of
micromobilities requires optimisation of complex systems for efficiency,
environmental impact mitigation, and overcoming technical challenges for user
safety. Machine Learning (ML) methods have been c...
Авторы:
Selen Gecgel Cetin, Tolga Ovatman, Gunes Karabulut Kurt
## Контекст
В настоящее время сети пространственной коммуникации становятся все более сложными, включая новые типы связи и технологии, такие как "intershell links". Эти сети функционируют в условиях высоких рисков для безопасности и надежности, которые могут быть причиной серьезных последствий для операторов и пользователей. Однако существующие методы оценки угроз часто ориентированы на отдельные аспекты, такие как надежность или безопасность, что приводит к неэффективному использованию ресурсов и увеличивает риск пропуска угроз. Это вызывает необходимость в разработке новых подходов к повышению анализа угроз в пространственных сетях, которые могли бы объединить достоинства и предполагаемые цели в одной модели. Разработка такого подхода не только улучшит моделирование угроз, но и обеспечит более эффективную защиту сетей в условиях повышенного риска.
## Метод
Методология основывается на создании целенаправленных моделей угроз, которые учитывают как возможности, так и предполагаемые цели. Для повышения надежности и безопасности разработана архитектура, состоящая из трех главных этапов. В первом этапе предлагается алгоритм, извлекающий характеристики полученного сигнала, что позволяет уточнить потенциальные угрозы. Во втором этапе разработана многозадачная структура обучения, в которой одна задача стремится оценивать качество связи, а другая анализирует цели и предполагаемые цели, присущие сигналу. Наконец, в качестве третьего этапа предлагается адаптивная модель оценки угроз, которая может реагировать на изменение требований к безопасности и надежности в разных ситуациях. Эта модель лучше подходит для систем с интерсетчатыми связями, чем традиционные последовательные методы.
## Результаты
Выполнены эксперименты, в которых использовались симулированные данные, описывающие сетевые сценарии с разными уровнями надежности и безопасности. Результаты показали, что предлагаемый подход превышает показатели стандартных методов с последовательным подходом в обнаружении угроз. Например, новая модель демонстрирует значительное улучшение в скорости и точности определения угроз, в том числе при атаках, которые могут быть пропущены при использовании стандартных техник. Это демонстрирует эффективность подхода в условиях сложных сетевых сценариев.
## Значимость
Разработанная модель может использоваться в различных сферах, включая сети космической связи, гражданскую защиту и безопасность государственных систем. Основное преимущество заключается в том, что она объединяет два ключ
Annotation:
This letter addresses essential aspects of threat assessment by proposing
intent-driven threat models that incorporate both capabilities and intents. We
propose a holistic framework for cyber physical awareness (CPA) in space
networks, pointing out that analyzing reliability and security separately can
lead to overfitting on system-specific criteria. We structure our proposed
framework in three main steps. First, we suggest an algorithm that extracts
characteristic properties of the received sig...
Авторы:
Samuel Yen-Chi Chen, Prayag Tiwari
## Контекст
В последние годы возрастает интерес к интеграции квантовых вычислений с машинным обучением (QML). Квантовые рекуррентные модели, такие как QLSTM, показали свою эффективность в задачах последовательных данных, таких как прогнозирование рядов временных значений, обработка естественного языка и распределенное обучение с подкреплением. Однако создание эффективных вариационных квантовых схем (VQCs) остается сложной и задачеподобной проблемой. Быстро развивающиеся технологии QML требуют автоматизированных способов для оптимизации этих схем, чтобы улучшить их общую эффективность и область применения.
## Метод
Мы предлагаем DiffQAS-QLSTM, современный процесс поиска архитектуры, который автоматически оптимизирует параметры и архитектуру квантовой рекуррентной схемы QLSTM. Это решение является градиентно-непрерывной и интегрирует оптимизацию параметров с решением архитектурной задачи в едином рампараметрическом подходе. Мы аппроксимируем VQCs с помощью дифференцируемых моделей, чтобы обеспечить связанность между архитектурными элементами и потерями. Таким образом, DiffQAS-QLSTM позволяет адаптивно выбирать архитектуру VQC во время обучения, чтобы максимизировать производительность модели.
## Результаты
Мы проводим эксперименты с различными синтетическими и реальными данными, включая ряды временных значений и естественный язык. Наши результаты показали, что DiffQAS-QLSTM существенно превосходит ручно сконструированные базовые модели по метрикам потерь и точности прогнозирования. Особое внимание уделено сравнению с использованием метрик, таких как Mean Squared Error (MSE) и BLEU, где DiffQAS-QLSTM достигает значительно низких показателей потерь и высокой точности.
## Значимость
Предлагаемый подход может быть применен в широкой области задач, включая прогнозирование течения временных рядов, обработку естественного языка, и распределенное обучение с подкреплением. За счет адаптивности и эффективности, DiffQAS-QLSTM открывает новые возможности для устойчивого и сбалансированного использования квантовых вычислений в QML. Это может иметь большое значение в приложениях, где требуется высокая точность во временных рядах или естественном языке.
## Выводы
Мы представляем DiffQAS-QLSTM, первый автоматический подход к оптимизации вариационных квантовых схем для последовательных задач обучения. Наши результаты показали, что DiffQAS-QLSTM превосходит ручно сконструированные модели в различных задачах и показывает свою эффективность и стойкость. Мы считаем, что это развитие может стать отправной точкой для будущих исследований в области квантового машинно
Annotation:
Recent advances in quantum computing and machine learning have given rise to
quantum machine learning (QML), with growing interest in learning from
sequential data. Quantum recurrent models like QLSTM are promising for
time-series prediction, NLP, and reinforcement learning. However, designing
effective variational quantum circuits (VQCs) remains challenging and often
task-specific. To address this, we propose DiffQAS-QLSTM, an end-to-end
differentiable framework that optimizes both VQC paramete...
Авторы:
H. I. Nurdin, C. A. Nijhuis
## Контекст
Исследование сосредоточено на моделировании динамического молекулярного ключа, которое эмулирует процесс работы синапсов в мозгу. Этот подход имеет прямую связь с нейронауками, когда стабильная обработка временных данных является ключевой задачей для эмуляции работы нейронных сетей. Недостаток существующих моделей заключается в том, что они либо недостаточно точно эмулируют поведение молекулярных систем, либо не обладают свойствами, необходимыми для стабильного выполнения вычислений в последовательных данных. Эта проблема требует разработки методов, объединяющих биологическую соответствие и математическую стабильность.
## Метод
Модель представляет собой односостоятельное дифференциальное уравнение, дискретное во времени, в котором входные сигналы влияют на выходные значения. Модель является линейной в состоянии, но нелинейной относительно входных данных. Она была построена с целью эмуляции динамических свойств молекулярных ключей, позволяя исследовать их взаимосвязь с поведением нейронных сетей. Аналитические вычисления использовались для доказательства свойств такой модели, таких как выходная функция, затухание памяти и устойчивость к входным изменениям.
## Результаты
Эксперименты показали, что модель успешно эмулирует динамические свойства молекулярных ключей, в том числе их способность взаимодействовать с последовательными данными. Это достигается благодаря узкому диапазону входных сигналов и их нелинейной обработке. Результаты показали, что модель обладает устойчивостью к изменениям входных данных, что является ключевым требованием для стабильной обработки временных данных. Эти результаты подтверждают модель как подходящую для использования в нейронных сетях и моделировании биологических систем.
## Значимость
Результаты могут быть применены в области нейроинспирированного вычисления, где необходимо эмулировать работу мозга. Модель может применяться для создания слоев в нейронных сетях, которые обеспечивают более точное моделирование работы нейронов. Благодаря своему подходу, модель может быть расширена для моделирования других биологических систем, которые также требуют стабильной обработки временных данных. Это открывает новые возможности в исследовании молекулярных систем, управления и нейрокомпьютеров.
## Выводы
Модель динамического молекулярного ключа, разработанная в рамках данного исследования, обладает свойствами, необходимыми для стабильной обработки временных данных. Она демонстрирует широкую теоретическую и практическую значимость для развития нейрокомпьютеров и моделирования биологических систем. Будущие исс
Annotation:
This paper studies an input-driven one-state differential equation model
initially developed for an experimentally demonstrated dynamic molecular switch
that switches like synapses in the brain do. The linear-in-the-state and
nonlinear-in-the-input model is exactly solvable, and it is shown that it also
possesses mathematical properties of convergence and fading memory that enable
stable processing of time-varying inputs by nonlinear dynamical systems. Thus,
the model exhibits the co-existence o...
Авторы:
Md Zesun Ahmed Mia, Malyaban Bal, Sen Lu, George M. Nishibuchi, Suhas Chelian, Srini Vasan, Abhronil Sengupta
## КОНТЕКСТ И ПРОБЛЕМАТИКА
Современные системы обнаружения сетевых вторжений (NIDS) сталкиваются с фундаментальным противоречием между необходимостью постоянной адаптации к новым видам киберугроз и риском катастрофического забывания ранее изученных паттернов. Традиционные ИИ-подходы, основанные на глубоком обучении, демонстрируют высокую точность при обучении на статических наборах данных, но теряют эффективность в условиях реального времени, где поток сетевого трафика непрерывно эволюционирует и появляются ранее неизвестные типы атак.
Ключевыми проблемами являются: во-первых, энергетическая неэффективность классических нейросетей, требующих значительных вычислительных ресурсов для обработки высокоскоростного трафика; во-вторых, неспособность к инкрементальному обучению без полного переобучения модели; в-третьих, отсутствие механизмов, позволяющих сохранить знания о старых атаках при изучении новых. Эти ограничения особенно критичны для встраиваемых систем и edge-устройств, где доступны ограниченные вычислительные ресурсы и энергия.
Нейроморфные вычисления, вдохновленные принципами работы биологического мозга, предлагают революционный подход к решению этих проблем. Импульсные нейронные сети (SNN) обеспечивают исключительную энергоэффективность за счет асинхронной обработки информации и sparse-кодирования, тогда как биологически правдоподобные механизмы пластичности позволяют реализовать непрерывное обучение в течение всего жизненного цикла системы. Однако до настоящего времени отсутствовали практические реализации SNN-архитектур, способных эффективно функционировать в динамических условиях кибербезопасности.
## ПРЕДЛОЖЕННЫЙ МЕТОД
Авторы предлагают двухуровневую иерархическую архитектуру нейроморфной системы обнаружения вторжений, которая решает проблему lifelong learning через разделение функций между статическим и динамическим компонентами. Первый уровень представляет собой статическую SNN, обученную на начальном наборе данных для первичной фильтрации потенциально вредоносного трафика. Эта сеть работает в режиме энергоэффективного инференса с высокой степенью разреженности активаций (до 95%), что критично для реального времени.
Когда статический классификатор обнаруживает подозрительную активность, активируется второй уровень - адаптивный динамический SNN-классификатор. Этот компонент реализует принципиально новый подход к continual learning через комбинацию двух биологически инспирированных механизмов. Первый механизм основан на Grow When Required (GWR)-подобной структурной пластичности, позволяющей динамически добавлять новые нейроны в ответ на появление неизвестных паттернов атак. Второй механизм - это разработанная авторами адаптивная правило Spike-Timing-Dependent Plasticity (Ad-STDP), которое модифицирует силу синаптических связей в зависимости от временных корреляций между нейронами.
Ad-STDP выходит за рамки классического STDP через введение метапараметров, которые автоматически регулируют скорость обучения для каждого синапса индивидуально. Это позволяет сохранять важные связи, отвечающие за распознавание известных атак, одновременно формируя новые связи для изучаемых угроз. Система использует semi-supervised подход: при наличии меток классов происходит обучение с учителем, в отсутствие меток - самообучение на основе кластеризации импульсных паттернов.
Для обработки сетевых данных разработан специализированный энкодер, преобразующий признаки сетевого трафика в временные импульсные последовательности. Этот процесс учитывает как статистические характеристики пакетов (размеры, временные интервалы), так и поведенческие паттерны (последовательности флагов TCP, частоты обращений к портам).
## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ
Экспериментальная валидация проводилась на стандартном наборе данных UNSW-NB15, содержащем 2.54 миллиона записей сетевого трафика с 49 типами атак, распределенных по 9 категориям. Для создания реалистичного сценария lifelong learning, исходный набор данных был разделен на 5 временных срезов, каждый из которых добавлял 20% новых типов атак, недоступных предыд
Annotation:
Inspired by the brain's hierarchical processing and energy efficiency, this
paper presents a Spiking Neural Network (SNN) architecture for lifelong Network
Intrusion Detection System (NIDS). The proposed system first employs an
efficient static SNN to identify potential intrusions, which then activates an
adaptive dynamic SNN responsible for classifying the specific attack type.
Mimicking biological adaptation, the dynamic classifier utilizes Grow When
Required (GWR)-inspired structural plastici...
Авторы:
Md Zesun Ahmed Mia, Malyaban Bal, Sen Lu, George M. Nishibuchi, Suhas Chelian, Srini Vasan, Abhronil Sengupta
## КОНТЕКСТ И ПРОБЛЕМАТИКА
В современном мире кибербезопасности крайне важно обеспечить эффективную защиту сетевых систем от возрастающего количества киберугроз. Традиционные методы киберзащиты часто сталкиваются с ограничениями, такими как высокая стоимость вычислений, риск катастрофического забывания (catastrophic forgetting) при обучении на новых данных и невозможность эффективно адаптироваться к непредвиденным угрозам. Эти проблемы становятся особенно актуальными в контексте Network Intrusion Detection Systems (NIDS), требующих высокого уровня точности и энергоэффективности.
Биологический мозг является источником вдохновения для разработки более эффективных систем, благодаря его способности к иерархической обработке информации и энергоэффективности. Исходя из этого, разработка нейроморфических систем, основанных на спайковых нейронных сетях (Spiking Neural Networks, SNN), является перспективным направлением. SNN могут эмулировать нейробиологические механизмы, такие как структурная пластичность и адаптивное обучение, что позволяет им обрабатывать данные в реальном времени и обучаться на новых угрозах без потери существующих знаний.
Однако разработка SNN для NIDS сопровождается рядом вызовов, включая необходимость обработки потоковых данных в режиме реального времени, обеспечение энергоэффективности и уменьшение катастрофического забывания при обучении на новых угрозах. Таким образом, необходимо разработать методологии, которые бы объединили высокую точность классификации, адаптивность и энергоэффективность в единой системе.
## ПРЕДЛОЖЕННЫЙ МЕТОД
В данной статье предлагается нейроморфическая архитектура для NIDS, основанная на двух слоях SNN. Первый слой, статический SNN, выполняет первичную фильтрацию потенциальных угроз. Затем активируется динамический SNN, отвечающий за детальную классификацию типов атак.
Динамический SNN использует механизм Grow When Required (GWR), который позволяет сети динамически расширять свою структуру для обучения новых угроз. Для обучения используется новый Adaptive Spike-Timing-Dependent Plasticity (Ad-STDP), который оптимизирует синптические веса в соответствии с временными динамиками спайков, обеспечен
Annotation:
Inspired by the brain's hierarchical processing and energy efficiency, this
paper presents a Spiking Neural Network (SNN) architecture for lifelong Network
Intrusion Detection System (NIDS). The proposed system first employs an
efficient static SNN to identify potential intrusions, which then activates an
adaptive dynamic SNN responsible for classifying the specific attack type.
Mimicking biological adaptation, the dynamic classifier utilizes Grow When
Required (GWR)-inspired structural plastici...