📚 Саммари научных статей из arXiv

Найдено 2901 результатов по запросу 'cs.LG, cs.AI' Сбросить поиск

📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня

📄 Neuromorphic Cybersecurity with Semi-supervised Lifelong Learning

2025-08-09

Авторы:

Md Zesun Ahmed Mia, Malyaban Bal, Sen Lu, George M. Nishibuchi, Suhas Chelian, Srini Vasan, Abhronil Sengupta

## КОНТЕКСТ И ПРОБЛЕМАТИКА Современные системы обнаружения сетевых вторжений (NIDS) сталкиваются с фундаментальным противоречием между необходимостью постоянной адаптации к новым видам киберугроз и риском катастрофического забывания ранее изученных паттернов. Традиционные ИИ-подходы, основанные на глубоком обучении, демонстрируют высокую точность при обучении на статических наборах данных, но теряют эффективность в условиях реального времени, где поток сетевого трафика непрерывно эволюционирует и появляются ранее неизвестные типы атак. Ключевыми проблемами являются: во-первых, энергетическая неэффективность классических нейросетей, требующих значительных вычислительных ресурсов для обработки высокоскоростного трафика; во-вторых, неспособность к инкрементальному обучению без полного переобучения модели; в-третьих, отсутствие механизмов, позволяющих сохранить знания о старых атаках при изучении новых. Эти ограничения особенно критичны для встраиваемых систем и edge-устройств, где доступны ограниченные вычислительные ресурсы и энергия. Нейроморфные вычисления, вдохновленные принципами работы биологического мозга, предлагают революционный подход к решению этих проблем. Импульсные нейронные сети (SNN) обеспечивают исключительную энергоэффективность за счет асинхронной обработки информации и sparse-кодирования, тогда как биологически правдоподобные механизмы пластичности позволяют реализовать непрерывное обучение в течение всего жизненного цикла системы. Однако до настоящего времени отсутствовали практические реализации SNN-архитектур, способных эффективно функционировать в динамических условиях кибербезопасности. ## ПРЕДЛОЖЕННЫЙ МЕТОД Авторы предлагают двухуровневую иерархическую архитектуру нейроморфной системы обнаружения вторжений, которая решает проблему lifelong learning через разделение функций между статическим и динамическим компонентами. Первый уровень представляет собой статическую SNN, обученную на начальном наборе данных для первичной фильтрации потенциально вредоносного трафика. Эта сеть работает в режиме энергоэффективного инференса с высокой степенью разреженности активаций (до 95%), что критично для реального времени. Когда статический классификатор обнаруживает подозрительную активность, активируется второй уровень - адаптивный динамический SNN-классификатор. Этот компонент реализует принципиально новый подход к continual learning через комбинацию двух биологически инспирированных механизмов. Первый механизм основан на Grow When Required (GWR)-подобной структурной пластичности, позволяющей динамически добавлять новые нейроны в ответ на появление неизвестных паттернов атак. Второй механизм - это разработанная авторами адаптивная правило Spike-Timing-Dependent Plasticity (Ad-STDP), которое модифицирует силу синаптических связей в зависимости от временных корреляций между нейронами. Ad-STDP выходит за рамки классического STDP через введение метапараметров, которые автоматически регулируют скорость обучения для каждого синапса индивидуально. Это позволяет сохранять важные связи, отвечающие за распознавание известных атак, одновременно формируя новые связи для изучаемых угроз. Система использует semi-supervised подход: при наличии меток классов происходит обучение с учителем, в отсутствие меток - самообучение на основе кластеризации импульсных паттернов. Для обработки сетевых данных разработан специализированный энкодер, преобразующий признаки сетевого трафика в временные импульсные последовательности. Этот процесс учитывает как статистические характеристики пакетов (размеры, временные интервалы), так и поведенческие паттерны (последовательности флагов TCP, частоты обращений к портам). ## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ Экспериментальная валидация проводилась на стандартном наборе данных UNSW-NB15, содержащем 2.54 миллиона записей сетевого трафика с 49 типами атак, распределенных по 9 категориям. Для создания реалистичного сценария lifelong learning, исходный набор данных был разделен на 5 временных срезов, каждый из которых добавлял 20% новых типов атак, недоступных предыд

Annotation:

Inspired by the brain's hierarchical processing and energy efficiency, this paper presents a Spiking Neural Network (SNN) architecture for lifelong Network Intrusion Detection System (NIDS). The proposed system first employs an efficient static SNN to identify potential intrusions, which then activates an adaptive dynamic SNN responsible for classifying the specific attack type. Mimicking biological adaptation, the dynamic classifier utilizes Grow When Required (GWR)-inspired structural plastici...

ID: 2508.04610v2 cs.LG, cs.AI, cs.ET, cs.NE

arXiv PDF

📄 Uncertainty-aware Predict-Then-Optimize Framework for Equitable Post-Disaster Power Restoration

2025-08-09

Авторы:

Lin Jiang, Dahai Yu, Rongchao Xu, Tian Tang, Guang Wang

## КОНТЕКСТ И ПРОБЛЕМАТИКА Климатические изменения и рост частоты экстремальных погодных явлений, таких как ураганы, привели к увеличению числа сбоев в работе энергетических систем. Этот фактор подчеркивает критическую необходимость эфтизвующего и справедливого восстановления электроснабжения. Традиционно, компании-провайдеры электроэнергии определяют приоритеты восстановления на основе количества заявок на восстановление поданных из каждого региона. Однако, данные анализы показывают значительные диспаратические различия в объеме поданных заявок. Неблагоприятные сообщества часто подают меньше заявок, что приводит к несправедливости в процессе восстановления. Такая несправедливость оставляет эти сообщества без поддержки, увеличивая их уязвимость к продолжительным отключениям электроэнергии. Для решения этой проблемы, необходимо разработать стратегию восстановления электроснабжения, которая бы учитывала как эффективность, так и справедливость в отношении различных сообществ. Однако, достижение этой цели сталкивается с двумя ключевыми проблемами. Во-первых, необходимо предсказать время ремонта с учетом значительных различий в данных (dataset heteroscedasticity). Во-вторых, агенты обученные с помощью reinforcement learning (RL), имеют тенденцию предпочитать действия с низкой неопределенностью, что может подрывать справедливость решений. Для преодоления этих вызовов, авторы предлагают новый метод, который балансирует эффективность и справедливость в процессе восстановления электроснабжения. ## ПРЕДЛОЖЕННЫЙ МЕТОД Авторы предлагают метод под названием EPOPR (Equity-aware Predict-Then-Optimize Framework for Power Restoration), который состоит из двух ключевых компонентов. Первый компонент — **Equity-Conformalized Quantile Regression (ECQR)**. Этот метод используется для предсказания времени ремонта с учетом неопределенности. Он позволяет создавать прогнозы, которые не только опираются на исторические данные, но и учитывают различия в неопределенности между различными регионами. Это помогает снизить влияние неравномерности данных на качество прогнозов. Второй компонент — **Spatial-Temporal Attentional RL (STARL)**. Этот компонент предназначен для принятия решений с учетом пространственно-временных зависимостей и различий в неопределенности между регионами. STARL адаптируется к изменяющимся уровням неопределенности, что позволяет сделать процесс принимания решений более справедливым. Агент RL использует эти прогнозы для оптимизации процесса восстановления, обеспечивая баланс между эффективностью и справедливостью. ## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ Для оценки эффективности метода EPOPR, авторы проводят серию экспериментов на реальных данных. Данные включают информацию о заявках на восстановление электроснабжения и времени ремонта из различных регионов. Результаты показывают, что метод EPOPR уменьшает среднее время отключения электроэнергии на 3.60% по сравнению со стандартными методами. Кроме того, EPOPR снижает несправедливость между различными сообществами на 14.19%, что является значительным улучшением по сравнению с современными подходами. В экспериментах также продемонстрировано, что EPOPR эффективно адаптируется к различиям в неопределенности между регионами, обеспечивая более справедливое распределение ресурсов. Это подтверждает, что метод не только повышает эффективность восстановления, но и создает более справедливую систему для всех сообществ. ## ПРАКТИЧЕСКАЯ ЗНАЧИМОСТЬ Предложенный метод EPOPR имеет широкий спектр применений в области управления энергетическими системами, особенно в ситуациях экстремальных погодных условий. Он может быть использован электроснабжающими компаниями для оптимизации процесса восстановления электроснабжения после катастроф, таких как ураганы или землетрясения. Основными преимуществами EPOPR являются: - **Улучшение эффективности**: Снижение среднего времени отключения электроэнергии. - **Повышение справедливости**: Уменьшение диспаратических различий между сообществами. - **Адаптивность**: Учет пространственно-временных зависимостей и неопределенности. Такой подход может быть важен для повышения устойчивости и справедливости энергетических систем, особенно в регионах с высокой вулнерабельностью к погодным катастрофам. ## ВЫВОДЫ И ПЕРСПЕКТИВЫ В работе представлен новый метод EPOPR, который обеспечивает баланс между эффективностью и справедливостью в процессе восстановления электроснабжения. Основные достижения включают уменьшение среднего времени отключения и снижение несправедливости между сообществами. В будущем, этот метод может быть расширен для учета других факторов, таких как экономические и социальные аспекты, для еще более комплексного подхода к управлению энергетическими системами. Кроме того, дальнейшие исследования могут фокусироваться на интеграции EPOPR с другими технологиями, такими как искусственный интеллект и IoT, для создания более устойчивых и адаптивных систем энергоснабжения.

Annotation:

The increasing frequency of extreme weather events, such as hurricanes, highlights the urgent need for efficient and equitable power system restoration. Many electricity providers make restoration decisions primarily based on the volume of power restoration requests from each region. However, our data-driven analysis reveals significant disparities in request submission volume, as disadvantaged communities tend to submit fewer restoration requests. This disparity makes the current restoration so...

ID: 2508.04780v1 cs.LG, cs.AI, cs.SI

arXiv PDF

📄 Multi-Stage Knowledge-Distilled VGAE and GAT for Robust Controller-Area-Network Intrusion Detection

2025-08-09

Авторы:

Robert Frenken, Sidra Ghayour Bhatti, Hanqin Zhang, Qadeer Ahmed

## КОНТЕКСТ И ПРОБЛЕМАТИКА Контроллер Area Network (CAN) является широко используемым протоколом для взаимодействия внутри автомобилей, обеспечивая надежную передачу данных между электронными компьютерными системами. Однако, несмотря на его эффективность, CAN открыт для кибер-атак из-за отсутствия встроенных механизмов безопасности. Это делает автомобили уязвимыми к несанкционному вмешательству, что может привести к серьезным последствиям, включая потерю контроля над автомобилем. Интрусивное обнаружение (Intrusion Detection System, IDS) является ключевым решением для обеспечения безопасности CAN. Однако, существующие методы IDS для CAN-трафика сталкиваются с несколькими проблемами, включая классическую несбалансированность данных (class imbalance), высокую сложность моделей, и ограниченную эффективность в реальных условиях. Основным вызовом является разработка методологии, которая может эффективно обнаруживать аномалии и кибер-атаки в CAN-трафике, особенно когда данные характеризуются высокой несбалансированностью классов. Традиционные методы, основанные на статистических моделях или машинном обучении, часто не справляются с этими вызовами из-за недостатка мощности модели или недостаточного учета временных и структурных зависимостей в данных. Предлагаемая статья предлагает инновационный подход, который сочетает неконтролируемые методы обнаружения аномалий (unsupervised anomaly detection) и контролируемые графовые модели обучения (supervised graph learning) для улучшения точности и эффективности обнаружения атак в CAN-протоколе. Этот подход использует графовые модели для моделирования временных и структурных отношений между сообщениями CAN, что позволяет более точно определять аномалии и атаки. ## ПРЕДЛОЖЕННЫЙ МЕТОД Предлагаемая система интрусивного обнаружения основывается на многоступенчатой архитектуре, которая интегрирует Variational Graph Autoencoder (VGAE) и Knowledge-Distilled Graph Attention Network (KD-GAT). Эта система разработана специально для обнаружения аномалий и кибер-атак в трафике CAN. Первым этапом является представление CAN-трафика в виде последовательностей графов, где узлы графа представляют отправителей и получателей сообщений, а ребра обозначают взаимодействия между ними. Это позволяет моделировать временные и структурные зависимости между сообщениями, что критически важно для обнаружения атак. Затем, VGAE используется для выявления структурных аномалий в графовой структуре. VGAE обучается на графовой представлении CAN-трафика для выявления необычных или подозрительных структур, которые могут указывать на атаку. Для решения проблемы классовой несбалансированности, VGAE также применяется для селективного undersampling, что помогает сократить количество данных без потери информации. На последующем этапе, Gra

Annotation:

The Controller Area Network (CAN) protocol is a standard for in-vehicle communication but remains susceptible to cyber-attacks due to its lack of built-in security. This paper presents a multi-stage intrusion detection framework leveraging unsupervised anomaly detection and supervised graph learning tailored for automotive CAN traffic. Our architecture combines a Variational Graph Autoencoder (VGAE) for structural anomaly detection with a Knowledge-Distilled Graph Attention Network (KD-GAT) for ...

ID: 2508.04845v1 cs.LG, cs.AI

arXiv PDF

📄 Provable Post-Training Quantization: Theoretical Analysis of OPTQ and Qronos

2025-08-09

Авторы:

Haoyu Zhang, Shihao Zhang, Ian Colbert, Rayan Saab

## КОНТЕКСТ И ПРОБЛЕМАТИКА Квантование после обучения (Post-Training Quantization, PTQ) представляет собой критически важный инструмент для снижения вычислительных и памятных затрат современных глубоких нейронных сетей, особенно крупных языковых моделей (Large Language Models, LLMs). В условиях экспоненциального роста размеров моделей, где параметры измеряются десятками и сотнями миллиардов, необходимость в эффективных методах сжатия без значительной потери качества становится первостепенной задачей. Среди существующих PTQ-алгоритмов фреймворк OPTQ (также известный как GPTQ) занял лидирующее положение благодаря своей вычислительной эффективности и сильной эмпирической производительности. Однако несмотря на широкое распространение OPTQ в практических приложениях, методология страдает от фундаментального недостатка: отсутствия строгих количественных теоретических гарантий. Это создает значительную проблему для практиков и исследователей, поскольку невозможно заранее предсказать, насколько точно квантованная модель будет приближать поведение оригинальной модели. Отсутствие теоретической базы также затрудняет обоснование практических эвристик, таких как порядок обработки признаков или выбор параметров регуляризации, что приводит к необходимости проведения дорогостоящих экспериментов для настройки гиперпараметров. Кроме того, современные PTQ-алгоритмы, включая Qronos - более современный метод, продемонстрировавший улучшенную эмпирическую производительность, также страдают от аналогичного недостатка теоретического обоснования. Это создает пробел между теорией и практикой, препятствуя систематическому улучшению методов квантования и ограничивая возможность их надежного применения в критически важных приложениях, где требуется строгий контроль над точностью. ## ПРЕДЛОЖЕННЫЙ МЕТОД Авторы представляют первый в своем роде количественный теоретический анализ OPTQ и связанных методов, предоставляя строгие гарантии ошибок для как детерминированных, так и стохастических вариантов алгоритма. Методология анализа строится на систематическом исследовании того, как итеративная процедура OPTQ накапливает квантовую ошибку на каждом шаге оптимизации. Ключевым элементом предложенного подхода является вывод неасимптотических оценок ошибки в 2-норме, которые явным образом зависят от калибровочных данных и параметра регуляризации, используемого в OPTQ. Это достигается через разложение общей ошибки квантования на отдельные компоненты, каждый из которых анализируется с использованием методов матричного анализа и теории аппроксимации. Особое внимание уделяется анализу эффекта упорядочивания признаков по убывающей норме - эвристики, широко используемой на практике, но до сих пор не имеющей теоретического обоснования. Для стохастического варианта алгоритма авторы устанавливают более сильные границы ошибки в infinity-норме, что позволяет контролировать необходимый алфавит квантования и особенно полезно для последующих слоев и нелинейностей. Анализ включает разработку новых вероятностных инструментов для оценки распределения ошибок квантования в многомерном пространстве, учитывающих корреляционную структуру весов. Расширение анализа на Qronos включает адаптацию разработанной методологии к специфическим особенностям этого алгоритма, включая его подход к обработке групп весов и использованию дополнительных оптимизационных техник. Это позволяет объяснить эмпирические преимущества Qronos через призму теоретических гарантий. ## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ Экспериментальная часть работы фокусируется на эмпирической валидации полученных теоретических границ через систематическое исследование поведения ошибок квантования на различных архитектурах нейронных сетей и наборах данных. Исследование охватывает как классические сверточные сети (ResNet, VGG), так и современные трансформерные модели, включая BERT и GPT-семейство, что обеспечивает комплексное понимание применимости теоретических результатов. Для валидации 2-норм границ используются синтетические и реальные калибровочные наборы данных различного размера, позволяющие исследовать зависимость ошибки квантования от объема калибровочных данных. Результаты дем

Annotation:

Post-training quantization (PTQ) has become a crucial tool for reducing the memory and compute costs of modern deep neural networks, including large language models (LLMs). Among PTQ algorithms, the OPTQ framework-also known as GPTQ-has emerged as a leading method due to its computational efficiency and strong empirical performance. Despite its widespread adoption, however, OPTQ lacks rigorous quantitative theoretical guarantees. This paper presents the first quantitative error bounds for both d...

ID: 2508.04853v1 cs.LG, cs.AI, cs.IT, cs.NA, math.IT, math.NA, 68T07, 68W25, 62M45, 68Q25

arXiv PDF

📄 Uncertainty Quantification for Surface Ozone Emulators using Deep Learning

2025-08-09

Авторы:

Kelsey Doerksen, Yuliya Marchetti, Steven Lu, Kevin Bowman, James Montgomery, Kazuyuki Miyazaki, Yarin Gal, Freddie Kalaitzis

## КОНТЕКСТ И ПРОБЛЕМАТИКА Загрязнение воздуха представляет собой глобальную угрозу здоровью человека: по состоянию на 2023 год, 94 % населения планеты подвержены воздействию загрязняющих веществ, превышающих безопасные уровни. Среди ключевых загрязнителей особое место занимает приземный озон (O₃) — вторичный поллютант, образующийся в результате фотохимических реакций между оксидами азота (NOx) и летучими органическими соединениями (VOC) при участии солнечного света. Точное моделирование концентраций приземного озона и драйверов его пространственно-временной изменчивости остаётся вызовом для современной науки. Традиционные физически обоснованные модели, такие как MOMO-Chem (Multi-mOdel Multi-cOnstituent Chemical data assimilation), страдают от систематических ошибок (смещений) при переходе от глобальных к региональным и локальным масштабам, критически важным для оценки воздействия на здоровье человека. Эти смещения могут достигать 20-40 % по абсолютным значениям озона, что делает результаты моделирования недостаточно надёжными для принятия решений в области государственной политики и общественного здравоохранения. Глубокое обучение (Deep Learning) демонстрирует значительный потенциал в захвате сложных нелинейных зависимостей в климатических данных, включая пространственно-временную структуру полей загрязнителей. Однако существующие эмуляторы на основе нейронных сетей страдают от двух ключевых недостатков: (1) отсутствие количественной оценки неопределённости предсказаний, и (2) ограниченная интерпретируемость «чёрных ящиков», что делает их непригодными для критически важных приложений в области здравоохранения и экологической политики. Авторы статьи поднимают фундаментальный вопрос: как создать достаточно точный и при этом надёжный эмулятор ошибок приземного озона, способный не только предсказывать систематические смещения физической модели, но и количественно оценивать доверительные интервалы этих предсказаний. Решение этой проблемы позволит выявить географические области, где физическая модель наиболее/наименее надёжна, и определить оптимальные местоположения наземных станций мониторинга для коррекции смещений. ## ПРЕДЛОЖЕННЫЙ МЕТОД Для решения поставленной задачи авторы разработали неопределённостно-ориентированную архитектуру на основе модифицированной U-Net сети, специально адаптированной для предсказания пространственных остатков (ошибок) модели MOMO-Chem в приземном слое атмосферы. Архитектура включает энкодер-декодер структуру с пропускными соединениями (skip connections), что позволяет сохранить как глобальную, так и локальную пространственную информацию о распределении загрязнителей. Для количественной оценки неопределённости были реализованы два взаимодополняющих подхода: 1. **Байесовский U-Net**: реализован через применение метода Monte Carlo Dropout (MC-Dropout) при инференсе. Во время предсказания сеть запускается многократно (T=50 итераций) с включённым dropout-слоем (p=0.1-0.3), генерируя ансамбль предсказаний. Статистика по ансамблю (среднее и стандартное отклонение) используется для получения предсказательного распределения. Этот метод обеспечивает апостериорную оценку неопределённости параметров модели. 2. **Квантильная регрессия**: модель обучается одновременно предсказывать три квантильные функции (0.1, 0.5, 0.9) для получения 80 %-ного доверительного интервала. Используется модифицированная функция потерь pinball loss, которая поощряет предсказание верхней и нижней границ неопределённости. Этот подход позволяет учитывать гетероскедастичность ошибок (зависимость дисперсии от входных переменных). Ключевыми входными признаками стали: - Пространственные поля остатков MOMO-Chem (разрешение 0.5°×0.5°) - Метеорологические переменные (температура, влажность, скорость ветра) - Информация о землепользовании (Land Use/Land Cover - LULC) из MODIS - Топографические характеристики (высота рельефа, расстояние до побережья) Модель обучалась на данных за 2018 год и валидировалась на июне 2019 для регионов Северной Америки и Европы. Использовалась стратегия пространственной кросс-валидации для предотвращения утеч

Annotation:

Air pollution is a global hazard, and as of 2023, 94\% of the world's population is exposed to unsafe pollution levels. Surface Ozone (O3), an important pollutant, and the drivers of its trends are difficult to model, and traditional physics-based models fall short in their practical use for scales relevant to human-health impacts. Deep Learning-based emulators have shown promise in capturing complex climate patterns, but overall lack the interpretability necessary to support critical decision m...

ID: 2508.04885v1 cs.LG, cs.AI

arXiv PDF

📄 Leveraging Deep Learning for Physical Model Bias of Global Air Quality Estimates

2025-08-09

Авторы:

Kelsey Doerksen, Yuliya Marchetti, Kevin Bowman, Steven Lu, James Montgomery, Yarin Gal, Freddie Kalaitzis, Kazuyuki Miyazaki

## КОНТЕКСТ И ПРОБЛЕМАТИКА Атмосферный озон является ключевым загрязняющим веществом, которое негативно воздействует на здоровье человека и экологические системы. Он является одной из главных причин преждевременной смертности, причем в 2019 году ассоциировано более 6 млн преждевременных смертей. Несмотря на развитие физико-базированных моделей, таких как MOMO-Chem, моделирование поверхностного озона на масштабах, критичных для здоровья человека, остается сложной задачей. Основная проблема заключается в неизвестных факторах, влияющих на тренды концентрации озона, особенно в урбанизированных регионах. Традиционные модели часто не могут точно предсказывать резидуальные отклонения (bias), что ограничивает их практическую ценность для разработки экологической политики. Мотивацией данного исследования является необходимость создания более точных методов оценки поверхностного озона, которые могли бы компенсировать недостатки физико-базированных моделей. Использование методологий машинного обучения, в том числе глубокого обучения, предлагает перспективы для точного анализа и коррекции bias, особенно при интеграции высокоразрешенных данных, таких как спутниковые изображения. Целью данной работы является исследование возможностей 2D-конволюционных нейронных сетей (CNN) для улучшения оценки поверхностного озона путем моделирования резидуальных отклонений физико-базированных моделей. ## ПРЕДЛОЖЕННЫЙ МЕТОД Исследователи предлагают архитектуру на основе 2D-конволюционных нейронных сетей для моделирования резидуальных отклонений (bias) модели MOMO-Chem. Эта архитектура разработана для анализа пространственных данных и учитывает сложные взаимосвязи между различными факторами, влияющими на концентрацию озона. Ключевой аспект метода — интеграция данных о землепользовании, полученных из высокоразрешенных спутниковых изображений, что позволяет улучшить точность моделирования. Метод включает в себя следующие этапы: 1. **Предобработка данных**: Сбор и нормализация данных о концентрации озона, а также дополнительные данные о землепользовании и других факторах. 2. **Архитектура модели**: 2D CNN используется для анализа двумерных пространственных данных. Архитектура оптимизирована для выявления сложных закономерностей в пространственных шаблонах bias. 3. **Обучение модели**: Использование данных из регионов Северной Америки и Европы для обучения модели. Используются резидуальные отклонения между наблюдаемыми и моделируемыми значениями озона. 4. **Валидация и тестирование**: Модель проверяется на независимых данных для оценки ее точности и общей эффективности. ## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ Исследование проведено на данных из Северной Америки и Европы, где концентрация поверхностного озона была измерена с высокой пространственной и временной разрешенностью. Модель CNN показала значительно лучшие результаты по сравнению с традиционными методами машинного обучения. Использование спутниковых данных о землепользовании значительно улучшило качество прогнозов, особенно в урбанизированных районах. Ключевые показатели эффективности: - **Снижение bias**: Модель CNN уменьшила среднеквадратическую ошибку (RMSE) резидуальных отклонений по сравнению с базовыми подходами. - **Важность данных о землепользовании**: Добавление высокоразрешенных данных улучшило прогнозы, особенно в регионах с высокой динамикой антропогенных изменений. - **Пространственная точность**: Модель лучше представляет пространственные шаблоны bias в урбанизированных и промышленных зонах. ## ПРАКТИЧЕСКАЯ ЗНАЧИМОСТЬ Разработанный метод имеет широкие применимости для улучшения мониторинга качества воздуха и разработки экологической политики. Точная оценка поверхностного озона может помочь в: - **Прогнозировании рисков для здоровья**: Улучшенные модели позволяют более точно оценивать риски, связанные с высокими концентрациями озона. - **Улучшение экологической политики**: Данные, полученные с помощью CNN, могут быть использованы для разработки более эффективных стратегий по снижению загрязнения воздуха. - **Научное понимание**: Исследование помогает выявить факторы, влияющие на bias в моделях, что может привести к улучшению физико-базированных моделей в будущем. ## ВЫВОДЫ И ПЕРСПЕКТИВЫ Данное исследование демонстрирует успешное применение глубокого обучения для коррекции bias в моделях поверхностного озона. Использование 2D CNN с высокоразрешенными данными о землепользовании показало высокую эффективность в регионах Северной Америки и Европы. В будущем, данный подход может быть расширен на другие регионы и загрязняющие вещества, что открывает новые возможности для мониторинга и управления качеством воздуха. Дальнейшие исследования могут фокусироваться на интеграции дополнительных данных, таких как метеорологические данные, для дальнейшего улучшения точности моделей.

Annotation:

Air pollution is the world's largest environmental risk factor for human disease and premature death, resulting in more than 6 million permature deaths in 2019. Currently, there is still a challenge to model one of the most important air pollutants, surface ozone, particularly at scales relevant for human health impacts, with the drivers of global ozone trends at these scales largely unknown, limiting the practical use of physics-based models. We employ a 2D Convolutional Neural Network based ar...

ID: 2508.04886v1 cs.LG, cs.AI

arXiv PDF

📄 MENDR: Manifold Explainable Neural Data Representations

2025-08-09

Авторы:

Matthew Chen, Micky Nnamdi, Justin Shao, Andrew Hornback, Hongyun Huang, Ben Tamo, Yishan Zhong, Benoit Marteau, Wenqi Shi, May Dongmei Wang

## КОНТЕКСТ И ПРОБЛЕМАТИКА Развитие нейронных сетей для обработки электроэнцефалограмм (ЭЭГ) открыло новые возможности в медицинской диагностике и монитории. Однако существующие модели, особенно фундаментальные модели (foundation models), сталкиваются с рядом проблем, связанных с их прозрачностью и интерпретируемостью. Многие модели не дают полного представления о том, как они обучаются на ЭЭГ-данных и как сохраняют информацию в их э Acidifications. Это ограничивает их применение в клинической практике, где необходимо не только высокое качество прогнозов, но и понимание того, как эти прогнозы формируются. Традиционные подходы к обработке ЭЭГ часто опираются на временную область, не полностью используя преимущества современных методов цифровой обработки сигналов, таких как вейвлет-трансформы. Эти методы позволяют извлекать детерминированные и трассируемые функциональные признаки с различными временными разрешениями. Кроме того, существующие модели часто требуют большого количества параметров, что создает дополнительные трудности для их эффективного использования в реальных клинических условиях. В этой связи возникает необходимость в разработке модели, которая бы объединила высокую точность, эффективность и прозрачность. Такая модель должна быть способна не только обрабатывать ЭЭГ-данные с высокой точностью, но и предоставлять интерпретируемые результаты, которые могут быть поняты клиническими специалистами. ## ПРЕДЛОЖЕННЫЙ МЕТОД В статье предлагается MENDR (Manifold Explainable Neural Data Representations), инновационная модель, основанная на трансформере и фильтровочной банковой архитектуре. Основная идея MENDR заключается в обучении на основе симметричных положительно определенных матричных представлений ЭЭГ-сигналов, которые позволяют более эффективно представлять и интерпретируемый контент. MENDR использует вейвлет-трансформы для разложения ЭЭГ-сигналов на многоуровневые коэффициенты, что позволяет сохранить информацию на различных временных масштабах. Модель обучается на большом корпусе данных, состоящем из более чем 4000 часов ЭЭГ-записей. Эта обучающая выборка обеспечивает разнообразие и объем данных, необходимый для формирования общих представлений. Архитектура MENDR включает в себя Riemannian Manifold Transformer, который позволяет обрабатывать симметричные положительно определенные матрицы. Этот подход обеспечивает более высокую точность и интерпретируемость, так как эти матрицы могут быть визуализированы в виде геометрических эллипсоидов, что упрощает анализ и понимание результатов. ## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ Для оценки эффективности MENDR проведены эксперименты на нескольких клинических задачах, связанных с анализом ЭЭГ. Модель демонстрирует результаты, близкие к лучшим решениям в отрасли, при этом требуя значительно меньшего количества параметров. Это подтверждает ее эффективность и потенциал для практического применения. В экспериментах также показано, что MENDR позволяет точно восстанавливать ЭЭГ-сигналы из полученных э Acidifications, что является важной характеристикой для клинического применения. Благодаря визуализации симметричных положительно определенных матриц в виде эллипсоидов, модель обеспечивает более прозрачный и понятный способ анализа данных. ## ПРАКТИЧЕСКАЯ ЗНАЧИМОСТЬ MENDR имеет значительный потенциал для применения в клинической практике. Благодаря своей прозрачности и интерпретируемости, модель может быть использована для более точного диагностирования и мониторинга состояния пациентов. Кроме того, ее эффективность и меньшее количество параметров делают ее более доступной для реального использования в клинических условиях. ## ВЫВОДЫ И ПЕРСПЕКТИВЫ MENDR представляет собой важный шаг в развитии интерпретируемых нейронных моделей для анализа ЭЭГ. Будущие исследования могут фокусироваться на дальнейшем улучшении архитектуры, а также на интеграции модели в более широкий контекст медицинских приложений.

Annotation:

Foundation models for electroencephalography (EEG) signals have recently demonstrated success in learning generalized representations of EEGs, outperforming specialized models in various downstream tasks. However, many of these models lack transparency in their pretraining dynamics and offer limited insight into how well EEG information is preserved within their embeddings. For successful clinical integration, EEG foundation models must ensure transparency in pretraining, downstream fine-tuning,...

ID: 2508.04956v1 cs.LG, cs.AI

arXiv PDF

📄 R-Zero: Self-Evolving Reasoning LLM from Zero Data

2025-08-09

Авторы:

Chengsong Huang, Wenhao Yu, Xiaoyang Wang, Hongming Zhang, Zongxia Li, Ruosen Li, Jiaxin Huang, Haitao Mi, Dong Yu

## КОНТЕКСТ И ПРОБЛЕМАТИКА Развитие ИИ привело к появлению мощных Large Language Models (LLMs), которые могут выполнять сложные задачи резонанса и логического вывода. Однако, несмотря на их способность к общению и решению задач, эти модели ограничены тем, что их обучение требует больших объемов человеческих данных, включая тщательно отмеченные наборы данных и человеческие образцы. Это создает серьезную проблему для развития ИИ, поскольку создание таких данных требует значительных ресурсов и человеческого вмешательства. Традиционные подходы, такие как fine-tuning и reinforcement learning, хорошо работают для доработки моделей, но они не могут обеспечить полностью автономное развитие моделей. Это становится ключевым ограничением для достижения супер-интеллектуальных систем, которые могли бы развиваться самостоятельно, не завися от человеческого вмешательства. Более того, большинство существующих подходов к обучению LLMs ограничены использованием данных, созданных человеком, что ограничивает возможности моделей в решении задач, которые выходят за рамки представленных данных. Мотивацией для разработки R-Zero является необходимость преодоления этого ограничения. Исследователи стремятся создать систему, которая может создавать, оптимизировать и улучшать свои собственные данные, без необходимости во внешних источниках. Такой подход может позволить LLMs развиваться в независимости от предоставленных человеком данных, что, в свою очередь, может привести к более сильным и автономным ИИ-системам. ## ПРЕДЛОЖЕННЫЙ МЕТОД R-Zero представляет собой новый фреймворк для автономного обучения LLMs, основанный на концепции самоэволюции. Он включает в себя два независимых модели: Challenger и Solver. Обе модели инициализируются на основе одной базовой LLM, но имеют разные роли. Challenger отвечает за генерацию задач, которые находятся на границе возможностей Solver, тогда как Solver пытается решить эти задачи. Процесс обучения основан на механизме взаимодействия между Challenger и Solver. Challenger получает награду за генерацию задач, которые Solver не может решить, но которые находятся на пределе его способностей. Это побуждает Challenger создавать все более сложные задачи. С другой стороны, Solver получает награду за успешное решение этих задач, что стимулирует его к постоянному улучшению. Этот процесс создает автономный куррикулум, который позволяет моделям эволюционировать вместе. Благодаря этому, R-Zero может работать без необходимости во внешних наборах данных, поскольку она генерирует свои собственные данные в процессе взаимодействия. Это позволяет моделям совершенствоваться в решении задач, которые имеют отношение к резонансу и логическому выводу, не требуя никаких внешних меток или человеческого вмешательства. ## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ Исследователи провели эксперименты, чтобы оценить эффективность R-Zero. Они использовали разные базовые модели LLMs, включая Qwen3-4B-Base, для проверки улучшений в решении задач резонанса и логического вывода. Результаты показали, что R-Zero значительно улучшил результаты моделей в различных задачах. Например, на математических задачах резонанса, Qwen3-4B-Base показала улучшение на +6.49 по сравнению с базовой моделью. Также, на задачах общего домена, улучшение составило +7.54. Эти результаты демонстрируют, что R-Zero эффективен в улучшении способностей резонанса моделей, даже при отсутствии внешних данных. Это подтверждает, что метод самоэволюции может быть использован для повышения способностей LLMs в решении сложных задач, не требуя больших наборов данных или человеческого вмешательства. ## ПРАКТИЧЕСКАЯ ЗНАЧИМОСТЬ R-Zero имеет потенциал применения в различных областях, где необходимо улучшение способностей резонанса и логического вывода LLMs. Также, он может быть использован в задачах, где требуется автономная разработка данных или обучение моделей в условиях отсутствия внешних источников данных. Это может быть полезно в таких областях, как образование, медицина, финансы и другие сферы, где необходимо решать сложные задачи, не имея доступа к большим наборам данных. Преимущества R-Zero в том, что он позволяет создавать модели, которые могут развиваться самостоятельно, не требуя больших инвестиций в создание данных. Это может существенно упростить процесс разработки и обучения моделей, особенно в ситуациях, где человеческие ресурсы ограничены. ## ВЫВОДЫ И ПЕРСПЕКТИВЫ R-Zero является важной шагом в развитии автономных LLMs, которые могут развиваться без необходимости во внешних данных. Он показывает, что самоэволюция может быть эффективным методом для улучшения способностей моделей в решении задач резонанса и логического вывода. Будущие исследования могут фокусироваться на дальнейшем улучшении этой методологии, включая расширение ее применимости к другим типам задач и моделей, а также исследование возможностей для применения этого подхода в реальных ситуациях.

Annotation:

Self-evolving Large Language Models (LLMs) offer a scalable path toward super-intelligence by autonomously generating, refining, and learning from their own experiences. However, existing methods for training such models still rely heavily on vast human-curated tasks and labels, typically via fine-tuning or reinforcement learning, which poses a fundamental bottleneck to advancing AI systems toward capabilities beyond human intelligence. To overcome this limitation, we introduce R-Zero, a fully a...

ID: 2508.05004v1 cs.LG, cs.AI, cs.CL

arXiv PDF

📄 SPaRFT: Self-Paced Reinforcement Fine-Tuning for Large Language Models

2025-08-09

Авторы:

Dai Do, Manh Nguyen, Svetha Venkatesh, Hung Le

--- title: КОНТЕКСТ И ПРОБЛЕМАТИКА --- ### message # КОНТЕКСТ И ПРОБЛЕМАТИКА Проблематика исследования заключается в недостаточной эффективности процессов fine-tuning больших языковых моделей (Large Language Models, LLMs) с помощью reinforcement learning (RL). Несмотря на высокую способность LLMs к решению задач логического вывода, применение RL требует значительных вычислительных ресурсов и больших объемов данных. Это делает такой подход малоэффективным для меньших моделей, которые могли бы пользоваться преимуществами RL без необходимости в таких объемах вычислений. Традиционные методы curriculum learning или выбора данных в основном опираются на гейстерические подходы, которые не всегда обеспечивают оптимальное использование ресурсов. Имеющиеся методы требуют значительных вычислительных затрат, что ограничивает их масштабируемость и применимость в реальных условиях. Таким образом, необходимо разработать более эффективный метод, позволяющий адаптировать процесс обучения к возможностям модели, оптимизируя выбор данных и время их использования. Задача состоит в том, чтобы создать фреймворк, который может решать эту проблему, обеспечивая высокую эффективность обучения за счет оптимизации выбора и порядка применения данных для обучения. Такой подход должен уменьшить количество необходимых выборок для достижения высоких результатов, что может быть критически важно для применения LLMs в реальных задачах с ограниченными вычислительными мощностями. # ПРЕДЛОЖЕННЫЙ МЕТОД В статье предлагается метод **SPaRFT** (Self-Paced Reinforcement Fine-Tuning), который представляет собой фреймворк для эффективного обучения LLMs с помощью RL, основанный на принципе self-paced learning. Основная идея заключается в том, чтобы оптимизировать выбор данных и порядок их использования в зависимости от текущих возможностей модели. В первую очередь, используется **кластеризация данных** (cluster-based data reduction), которая позволяет разделить обучающий набор на кластеры на основе семантических и сложностных характеристик. Это позволяет создать компактный, но разнообразный набор данных, который устраняет избыточность и повышает эффективность обучения. Далее, используется **множественный бандит** (multi-armed bandit), который рассматривает кластеры данных как "руки" (arms) и оптимизирует выбор данных на основе текущей производительности модели. Этот подход позволяет динамически регулировать выбор данных в зависимости от того, как хорошо модель справляется с различными кластерами. Таким образом, метод SPaRFT сочетает в себе эффективное управление данными и адаптивный подход к обучению, что позволяет достичь высоких результатов с минимальными ресурсами. # ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ Для оценки эффективности метода SPaRFT было проведено ряд экспериментов на различных бенчмарках по реазонанию. Эксперименты показали, что SPaRFT достигает результатов, сравнимых или лучших по сравнению со стандартными методами, при этом используя до \(100\times\) меньше данных для обучения. В экспериментах использовались разнообразные наборы данных, которые позволили продемонстрировать эффективность кластеризации и адаптивного выбора данных. Анализ результатов показал, что объединение кластеризации данных и множественного бандита значительно повышает эффективность обучения. Кроме того, были проведены абляционные исследования, которые подтвердили важность каждого из компонентов метода. # ПРАКТИЧЕСКАЯ ЗНАЧИМОСТЬ Практическая значение метода SPaRFT заключается в том, что он позволяет эффективно использовать ресурсы для обучения LLMs, что может быть критически важно в ситуациях, когда доступны ограниченные вычислительные мощности. Этот подход может быть применен в различных областях, где необходимо обучить модели с высокими требованиями к выводу, но при этом с ограничениями по ресурсам. SPaRFT также может быть полезен в ситуациях, когда необходимо быстро адаптировать модель к новым задачам, не требуя больших объемов данных для обучения. Это может быть особенно актуально в задачах, требующих быстрого развертывания моделей, таких как обработка естественного языка в реальном времени или решение задач, требующих высокой скорости адаптации. # ВЫВОДЫ И ПЕРСПЕКТИВЫ В рамках исследования было показано, что SPaRFT может значительно повысить эффективность обучения LLMs с помощью RL, оптимизируя процесс выбора данных и порядка их использования. Основным достижением является то, что метод позволяет достичь сравнимых или лучших результатов по сравнению со стандартными подходами, при этом значительно сокращая объем необходимых данных. Будущие исследования могут быть направлены на дальнейшее улучшение метода, в том числе на расширение его применимости к более широкому классу задач и моделей. Кроме того, можно рассмотреть возможность интеграции SPaRFT с другими методами обучения, чтобы достичь еще большей эффективности и масштабируемости.

Annotation:

Large language models (LLMs) have shown strong reasoning capabilities when fine-tuned with reinforcement learning (RL). However, such methods require extensive data and compute, making them impractical for smaller models. Current approaches to curriculum learning or data selection are largely heuristic-driven or demand extensive computational resources, limiting their scalability and generalizability. We propose \textbf{SPaRFT}, a self-paced learning framework that enables efficient learning bas...

ID: 2508.05015v1 cs.LG, cs.AI

arXiv PDF

📄 Learning from Oblivion: Predicting Knowledge Overflowed Weights via Retrodiction of Forgetting

2025-08-09

Авторы:

Jinhyeok Jang, Jaehong Kim, Jung Uk Kim

## КОНТЕКСТ И ПРОБЛЕМАТИКА Современное глубокое обучение опирается на предварительно обученные веса (pre-trained weights) как на фундаментальный инструмент переноса знаний, особенно в условиях дефицита данных для конкретных задач. Однако существует фундаментальное ограничение: качество предобученных весов напрямую зависит от объема и разнообразия исходного датасета. Традиционные подходы к улучшению предобученных моделей фокусируются на увеличении размеров архитектур или сборе больших массивов данных, что требует значительных вычислительных ресурсов и времени. Авторы статьи поднимают принципиально новый вопрос: возможно ли синтезировать "знания", превосходящие те, что содержатся в исходном датасете, без фактического увеличения объема обучающих данных? Эта проблема особенно актуальна в контексте ограниченных ресурсов и необходимости эффективного использования уже имеющихся моделей. Исследователи обращают внимание на феномен "структурированного забывания" (structured forgetting) - процесса, при котором модель последовательно теряет информацию при обучении на уменьшенных датасетах. Ключевое наблюдение заключается в том, что этот процесс забывания имеет определенную структуру и предсказуемость, что открывает возможность его инверсии для восстановления "утраченных" знаний. Это представляет собой парадигмальный сдвиг в понимании роли забывания в обучении нейронных сетей - вместо рассмотрения его как негативного явления, авторы предлагают использовать забывание как механизм извлечения дополнительных знаний. ## ПРЕДЛОЖЕННЫЙ МЕТОД Авторы представляют революционный подход KNowledge Overflowed Weights (KNOW) prediction, который использует мета-обучение для предсказания улучшенных предобученных весов. Методология строится на нескольких ключевых компонентах. Во-первых, создается контролируемый процесс забывания через последовательное дообучение (fine-tuning) модели на прогрессивно уменьшенных подмножествах исходного датасета. Это генерирует набор весовых переходов, которые формируют обучающую выборку для мета-модели. Центральным элементом подхода является KNowledge Overflowed Weights Nowcaster (KNOWN) - гипермодель, которая изучает общие закономерности эволюции весов во время процесса забывания. KNOWN использует архитектуру трансформера для моделирования сложных нелинейных зависимостей между весами на различных этапах забывания. Модель обучается предсказывать финальные веса, которые будут соответствовать состоянию, как если бы модель была обучена на большем датасете, чем доступный. Ключевым техническим решением является использование обратного процесса (retrodiction) - инверсии процесса забывания для генерации "переполненных знаний" весов. Это достигается через оптимизацию мета-функции потерь, которая минимизирует разницу между предсказанными весами и оптимальными весами, полученными через идеальный процесс обучения на расширенном датасете. Метод также включает механизмы регуляризации для предотвращения переобучения и обеспечения устойчивости предсказаний. ## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ Экспериментальная часть исследования охватывает широкий спектр архитектур и датасетов для демонстрации универсальности предложенного подхода. Исследователи использовали ResNet-50, Vision Transformer (ViT-B/16) и BERT-base модели на датасетах ImageNet, CIFAR-100, CIFAR-10 и GLUE. Для создания процесса забывания использовались различные стратегии сэмплирования, включая случайное удаление классов и пропорциональное уменьшение данных каждого класса. Результаты показывают последовательное превосходство KNOW prediction над наивным дообучением и простыми методами предсказания весов. На ImageNet с ResNet-50 метод показал улучшение точности на 3.2% по сравнению с базовым дообучением при использовании только 50% исходных данных. Для ViT на CIFAR-100 улучшение составило 5.7% точности. Особенно впечатляющие результаты получены в режиме крайне ограниченных данных (1-5% от исходного датасета), где KNOW показал до 12% улучшения. Анализ обобщающей способности показал, что предсказанные веса демонстрируют лучшую трансферную эффективность на смежных задачах. Н

Annotation:

Pre-trained weights have become a cornerstone of modern deep learning, enabling efficient knowledge transfer and improving downstream task performance, especially in data-scarce scenarios. However, a fundamental question remains: how can we obtain better pre-trained weights that encapsulate more knowledge beyond the given dataset? In this work, we introduce \textbf{KNowledge Overflowed Weights (KNOW)} prediction, a novel strategy that leverages structured forgetting and its inversion to synthesi...

ID: 2508.05059v1 cs.LG, cs.AI, cs.CV

arXiv PDF

1
2
285
286
287
288
289
290
291

Показано 2861 - 2870 из 2901 записей