📚 Саммари научных статей из arXiv

Найдено 74 результатов по запросу 'cs.LG, cs.NE' Сбросить поиск

📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня

📄 Semantic and episodic memories in a predictive coding model of the neocortex

2025-09-06

Авторы:

Lucie Fontaine, Frédéric Alexandre

## Контекст Интеллектуальные агенты требуют развития двух типов памяти: семантической и эпизодической. Семантическая память должна уметь хранить структурированные знания в виде двусторонних, перекрывающихся представлений. Эпизодическая память, свойственная гиппокампу, способна хранить внутренние специфичности отдельных индивидуальных опытов с помощью тесных, характерных представлений. Теория Комплементарных Систем Обучения утверждает, что теория этих двух систем обучения необходима для развития интеллектуальных систем. Несмотря на то, что у поведенческих моделей центральной нерелятивистской теории есть мощные характеристики, вызвано вопросы о том, как эти требования могут быть реализованы в нейронных сетях. Особенно значимо вопрос о том, может ли нейронная сеть выполнять такие эпизодические задачи. Модель предиктивного кодирования, показавшая биологически возможности, позволяет делать выводы о том, что она может работать с эпизодическими задачами, но только в ограниченной степени. Этот аспект поднимает вопросы о том, как эпизодические способности могут взаимодействовать с семантическими системами в моделях нейронных сетей. ## Метод Модель предиктивного кодирования, рассматриваемая в работе, использует нейронную сеть с нелинейным градиентом, которая моделирует зоны предиктивных клеток в нерелятивистской теории. Она использует технику предиктивного обучения, где модель постоянно предсказывает свое собственное входное состояние на основе прошлого и текущего состояния. Это позволяет модели выполнять такие задачи, как рекуррентное фильтрование и обратное решение, которые необходимы для эпизодических задач. Модель также содержит сетевые слои, которые собирают информацию с других слоев и позволяют выполнять автокодирование, которое является ключевым функционалом семантической памяти. Архитектура модели включает в себя слои сложности, которые могут выполнять различные задачи, включая те, что требуют эпизодических способностей. Модель также использует обучение нейронных сетей с помощью градиентного спуска. ## Результаты В экспериментах, проведенных на данной модели, была проверена способность модели выполнять эпизодические задачи. Были проведены эксперименты на двух типах данных: на малых наборах данных и на больших наборах данных. Удалось выяснить, что модель может выполнять эпизодические задачи, но только в случае малых наборов данных. Когда модель обучалась на больших наборах данных, она потеряла способность выполнять эпизодические задачи, и ее способность к ре

Annotation:

Complementary Learning Systems theory holds that intelligent agents need two learning systems. Semantic memory is encoded in the neocortex with dense, overlapping representations and acquires structured knowledge. Episodic memory is encoded in the hippocampus with sparse, pattern-separated representations and quickly learns the specifics of individual experiences. Recently, this duality between semantic and episodic memories has been challenged by predictive coding, a biologically plausible neur...

ID: 2509.01987v1 cs.LG, cs.NE

arXiv PDF

📄 Prediction, Generation of WWTPs microbiome community structures and Clustering of WWTPs various feature attributes using DE-BP model, SiTime-GAN model and DPNG-EPMC ensemble clustering algorithm with modulation of microbial ecosystem health

2025-09-05

Авторы:

Mingzhi Dai, Weiwei Cai, Xiang Feng, Huiqun Yu, Weibin Guo, Miao Guo

## Контекст Активированный серый песок (AS) широко используется в водоочистке для удаления полимеров и микробиологических элементов. Однако обработка AS с помощью микробного разложения требует понимания микробиологических сообществ в этих системах. Микробиомы играют ключевую роль в глобальных биогеохимических циклах и во взаимодействии между природными и инженерными системами. Несмотря на их важность, микробиомы остаются трудными для контроля и модификации в целях улучшения условий их эксплуатации. Особенно сложно это становится в сложных системах, таких как отходы от технологических процессов. Улучшение микробиологического контроля может привести к значительным повышениям эффективности водоочистки. Таким образом, целью данной работы является разработка модели для прогнозирования микробиологического состава AS, а также разработка методов кластеризации для анализа различных атрибутов WWTP, которые влияют на состояние микробиологического экосистемы. ## Метод Мы разработали модель DE-BP, основанную на сети глубокого обучения с подкреплением дифференциальной эволюцией (DE), для прогнозирования состава микробиологических сообществ AS в системах водоочистки. Модель оптимизирована для точного прогнозирования состава микробиологических сообществ в системах AS, собранных из WWTP по всему миру. Для кластеризации атрибутов WWTP мы предложили новую модель DPNG-EPMC, работающую на основе эмоциональной преференции и директивного положения. Кроме того, мы использовали SiTime-GAN, современную модель генерирующую адверсарную сеть, для генерирования новых микробиологических структур и атрибутов данных. Эти модели позволяют проанализировать и моделировать микробиологические сообщества, а также рассмотреть их влияние на состояние микробиологической экосистемы в WWTP. ## Результаты Мы провели эксперименты на данных, собранных из различных WWTP, используя DE-BP для прогнозирования состава микробиологических сообществ. Модель показала высокую точность прогнозирования. Далее, мы применили DPNG-EPMC для кластеризации атрибутов WWTP, включая качество воды, показатели выбросов и другие факторы, влияющие на процесс водоочистки. Наконец, мы использовали SiTime-GAN для генерирования и модификации микробиологических данных. Эти эксперименты показали, что DE-BP может предсказывать состав микробиологических сообществ с большей точностью, чем существующие модели. Кроме того, DPNG-EPMC доказал эффективность в анализе различных атрибутов WWTP, влияющих на микробиологическое состояние. Генеративная модель SiTime-GAN

Annotation:

Microbiomes not only underpin Earth's biogeochemical cycles but also play crucial roles in both engineered and natural ecosystems, such as the soil, wastewater treatment, and the human gut. However, microbiome engineering faces significant obstacles to surmount to deliver the desired improvements in microbiome control. Here, we use the backpropagation neural network (BPNN), optimized through differential evolution (DE-BP), to predict the microbial composition of activated sludge (AS) systems col...

ID: 2509.01526v1 cs.LG, cs.NE

arXiv PDF

📄 Analysis of Error Sources in LLM-based Hypothesis Search for Few-Shot Rule Induction

2025-09-05

Авторы:

Aishni Parab, Hongjing Lu, Ying Nian Wu, Sumit Gulwani

## Контекст Индуктивное обучение является ключевым аспектом человеческого мозга, позволяющим выводить абстрактные правила из ограниченных примеров и применять их к новым ситуациям. Однако существуют сложности в понимании, как машинное обучение может эффективно реализовать индуктивное обучение. В данном исследовании авторы сравнивают подходы гипотезы поиска с подходом прямого генерирования программ на основе машинного обучения, основанного на больших лингвистических моделях (LLM), для решения задач малоподкрепленного вывода правил. Эта проблема важна, поскольку поиск гипотез может стать мощным инструментом для моделирования индуктивного разума, но пока недостаточно изучен. ## Метод Методология исследования основывается на сравнении двух подходов: гипотезы поиска и прямого генерирования программ. Гипотеза поиска подразумевает, что большая лингвистическая модель создает список возможных гипотез, а затем их оценивают на основе тестирующих примеров. Прямое генерирование программ, напротив, прямо генерирует программу, которая решает задачу. Исследование использовало данные из существующих выборок для оценки качества вывода. Архитектура системы предполагает использование LLM для представления и поиска гипотез, а также для оценки их точности. ## Результаты В ходе экспериментов, проведенных на различных сетках данных, гипотезный поиск показал себя очень эффективно, приближаясь к решениям, достигаемым человеком, с почти одинаковой точностью. Однако прямое генерирование программ оказалось значительно менее эффективным, тем более что при поиске гипотез была достигнута высокая стабильность и низкая стоимость ошибок. Это демонстрирует, что поиск гипотез является более эффективным методом для решения задач малоподкрепленного вывода правил. ## Значимость Результаты исследования имеют значительное значение для многих областей, включая робототехнику, автоматизацию и научную исследовательскую деятельность. Гипотезный поиск может быть применен для моделирования индуктивного разума в системах, которые должны работать с ограниченными данными. Особым преимуществом является его высокая точность и устойчивость к ошибкам, что делает его привлекательным в ситуациях, где важно минимизировать ошибки. Этот подход может стать мощным инструментом для ускорения развития ИИ в области индуктивного обучения. ## Выводы Авторы заключают, что гипотезный поиск является эффективным подходом для решения задач малоподкрепленного вывода правил и может стать ключевым инструментом для моделирования индуктивного разума. Однако остаются нерешенными про

Annotation:

Inductive reasoning enables humans to infer abstract rules from limited examples and apply them to novel situations. In this work, we compare an LLM-based hypothesis search framework with direct program generation approaches on few-shot rule induction tasks. Our findings show that hypothesis search achieves performance comparable to humans, while direct program generation falls notably behind. An error analysis reveals key bottlenecks in hypothesis generation and suggests directions for advancin...

ID: 2509.01016v1 cs.AI, cs.CL, cs.LG, cs.NE

arXiv PDF

📄 Spacer: Towards Engineered Scientific Inspiration

2025-08-27

Авторы:

Minhyeong Lee, Suyoung Hwang, Seunghyun Moon, Geonho Nah, Donghyun Koh, Youngjun Cho, Johyun Park, Hojin Yoo, Jiho Park, Haneul Choi, Sungbin Moon, Taehoon Hwang, Seungwon Kim, Jaeyeong Kim, Seongjun Kim, Juneau Jung

## Контекст Настоящие предложения основываются на научной статье с названием "Spacer: Towards Engineered Scientific Inspiration", которая адресует сложные задачи, связанные со системами учебного искусственного интеллекта, а также требованиями к инновационности и творчеству в научных исследованиях. На данный момент, существующие системы, основанные на широко известных л LLM (Large Language Models), либо ограничены в своих возможностях, либо не могут достичь самостоятельного творчества в научных идеях. Такие ограждения приводят к необходимости в развитии новых методов, которые могут обеспечить более высокий уровень творчества и фактической грандиозности в научных исследованиях. Целью Spacer является развитие системы, которая может самостоятельно генерировать оригинальные и фактически сбалансированные научные идеи, полностью на основе нейроконцепций. ## Метод Spacer - это система, косвенно связанная с искусственным интеллектом, основанная на современных технологиях графов и творческих методов. Методология Spacer заключается в подходе, называемом "deliberate decontextualization". Данный подход заключается в разделении концепций на небольшие модули, или "ключевые слова", и поиск неожиданных связей между ними. Базируясь на этих запутанных связях, Spacer генерирует неповторимые научные направления. Механизмы Spacer включают два основных компонента: (i) Nuri, штурмовая система, которая строит и оценивает ключевые слова для статей на основе 180,000 публикаций в области биологии, и (ii) Manifesting Pipeline, которая превращает эти ключевые слова в полноценные научные концепции. Оба механизма работают вместе, чтобы приступить к генерации новых научных тезисов, которые могут быть экспериментально проверены. ## Результаты В рамках экспериментов, проведенных с Spacer, выяснилось, что Nuri, в качестве штурмовой системы, показала отличные результаты в классификации высокоимпактных статей с AUROC-метрикой в 0.737. Более того, она удачно распознает и выделяет те статьи, которые могут быть заложниками будущего учебного искусственного интеллекта. Также, Manifesting Pipeline удалось успешно реконструировать главные концепции из новых статей, генерируемых в топ-журналах, только на основе ключевых слов. Этот процесс эмпирически подтвердил, что Spacer в состоянии выполнять творческий анализ на базе лишь структуры ключей. Этот результат был подтвержден с помощью лингвистического моделирования, которая показала, что 85% случаев реконструкции концепций были успешными. Наконец, Spacer показал свою эффективность в сравнении с текущими лучшими резу

Annotation:

Recent advances in LLMs have made automated scientific research the next frontline in the path to artificial superintelligence. However, these systems are bound either to tasks of narrow scope or the limited creative capabilities of LLMs. We propose Spacer, a scientific discovery system that develops creative and factually grounded concepts without external intervention. Spacer attempts to achieve this via 'deliberate decontextualization,' an approach that disassembles information into atomic un...

ID: 2508.17661v1 cs.AI, cs.LG, cs.NE

arXiv PDF

📄 HEAS: Hierarchical Evolutionary Agent Simulation Framework for Cross-Scale Modeling and Multi-Objective Search

2025-08-23

Авторы:

Ruiyu Zhang, Lin Nie, Xin Zhao

#### Контекст Особенностью современных систем является их сложность, включающую в себя несколько уровней взаимодействия и происходящие на разных масштабах процессы. Это приводит к трудностям в моделировании и оптимизации систем, так как необходимо учитывать их различные аспекты и взаимосвязи. Разработка систем, включающих эволюционное моделирование и агентно-базированный подход, требует высокоуровневой абстракции и эффективных методов организации. Одной из мотиваций для разработки фреймворка является повышение гибкости и репрезентативности моделей, что позволяет упростить процессы решения задач в различных областях, включая экологию, экономику и системы управления. #### Метод Фреймворк HEAS (Hierarchical Evolutionary Agent Simulation) представляет модели как иерархии упрощенных процессов, называемых "потоками", которые выполняются в определенных слоях. Эти потоки читают и записывают общий контекст, что обеспечивает ясность взаимодействия между слоями и упрощает моделирование сложных систем. Фреймворк использует гибкую архитектуру, позволяющую совместно использовать модели для предсказаний, оптимизации, а также систематического сравнения. Он поддерживает не только моноблочное моделирование, но и разделение разных компонентов, что позволяет упростить их разработку и последующую модификацию. #### Результаты В рамках исследования были проведены эксперименты, которые продемонстрировали эффективность HEAS в моделировании различных сложных систем. Мы применили фреймворк для моделирования экологических систем, а также для решения задач оптимизации в сфере бизнеса. Результаты показали, что HEAS обеспечивает четкую моделирование сложности и эффективность в поиске решений. Мы получили доказательство того, что разделение логики моделирования и ее организации позволяет упростить реализацию и повысить точность. #### Значимость Разработанный фреймворк может быть применен во многих областях, где требуется моделирование сложных систем, включая экологию, бизнес-анализ, инженерию и другие. Особенностью HEAS является своя модульность и гибкость, которые позволяют быстро адаптироваться к различным задачам. Также, фреймворк обеспечивает высокую точность результатов и уменьшает время, затрачиваемое на разработку моделей. #### Выводы HEAS представляет собой мощный инструмент для моделирования сложных систем, объединяющий моделирование и оптимизацию в единой модели. Мы показали, что такой подход может быть применен в различных областях и обеспечивает высокую точность результатов. В будущем планируется расширить функциональность HEAS, включая поддержку более сложных сценариев и интеграцию с реаль

Annotation:

Hierarchical Evolutionary Agent Simulation (HEAS) is a Python framework that unifies layered agent-based modeling with evolutionary optimization and tournament evaluation in a single, reproducible workflow. HEAS represents models as hierarchies of lightweight processes ("streams") scheduled in deterministic layers that read and write a shared context, making cross-scale couplings explicit and auditable. A compact API and CLI-simulate, optimize, evaluate-expose single- and multi-objective evoluti...

ID: 2508.15555v1 cs.MA, cs.CE, cs.LG, cs.NE, cs.SE

arXiv PDF

📄 Understanding Textual Emotion Through Emoji Prediction

2025-08-16

Авторы:

Ethan Gordon, Nishank Kuppa, Rigved Tummala, Sriram Anasuri

################################# ## Контекст ################################# Текстовые эмоции являются ключевым аспектом в понимании человеческих отношений с компьютерами. Они позволяют системам анализировать интенции и усиливать пользовательский опыт. Однако, многие существующие модели страдают от проблемы классного несбалансированности и неэффективности в сложных случаях. Например, некоторые модели не могут точно предсказать редкие эмоциональные классы, что снижает их практическую ценность. Наша мотивация заключается в создании модели, которая не только обеспечивает высокую точность, но и эффективно работает с редкими классами, повышая роль эмоционального анализа в человеко-компьютерных взаимодействиях. ################################# ## Метод ################################# Чтобы понять текстовые эмоции, мы применяем четыре глубоких архитектуры: фидфорвардная сеть, зеркальная сеть, трансформер и BERT. Мы применяем набор данных TweetEval, который позволяет тренировать и проверять модели на текстовых последовательностях. Для присутствия классного несбалансированности используется фокусный потери и регуляризация. Это помогает сузить разрыв в производительности между более частыми и реже встречающимися классами, оптимизируя модель для лучшей общей точности и специфичности. ################################# ## Результаты ################################# Мы проводим эксперименты с каждой моделью, измеряя точность, F1-меру и скорость обучения. Результаты показывают, что BERT показывает наивысшую общую точность, благодаря своему предварительноучитываемому анализу. Однако CNN демонстрирует лучшую эффективность при работе с редкими классами, что улучшает поддержку эмоционального анализа. Регуляризация и фокусный потери показывают существенный вклад в качество предсказаний, особенно для редких классов. Таким образом, этот результат подтверждает, что выбор модели и оптимизация параметров важны для точного и эффективного текстового анализа эмоций. ################################# ## Значимость ################################# Наша работа будет иметь важное значение в различных областях, таких как социальные сети, маркетинг, и системы поддержки решений. Она позволяет системам лучше понимать и отвечать на эмоциональные состояния пользователей. Это может улучшить человеко-компьютерные взаимодействия, особенно в ситуациях, когда редкие эмоциональные классы требуют прецизионного анализа. Благодаря более точному и эффективному пониманию текстовых эмоций, наша модель может способствовать более естественному и эмоционально интеллектуальному общению. ################################# ## Выводы ################################# Наше исследование показывает, что выбор модели и оптимизация ключевые факторы для точного понимания текстовых эмоци

Annotation:

This project explores emoji prediction from short text sequences using four deep learning architectures: a feed-forward network, CNN, transformer, and BERT. Using the TweetEval dataset, we address class imbalance through focal loss and regularization techniques. Results show BERT achieves the highest overall performance due to its pre-training advantage, while CNN demonstrates superior efficacy on rare emoji classes. This research shows the importance of architecture selection and hyperparameter...

ID: 2508.10222v1 cs.CL, cs.AI, cs.LG, cs.NE

arXiv PDF

📄 Enhance the machine learning algorithm performance in phishing detection with keyword features

2025-08-15

Авторы:

Zijiang Yang

#### Контекст В последние годы становится очевидным возрастание числа фишинговых атак в сети Интернет. Фишинг — это тип атаки, в ходе которой злоумышленник создает поддельный сайт, аналогичный настоящему, с целью подловить конфиденциальную информацию пользователей. Такая атака может привести к краже личных данных и финансовым потерям. Для предотвращения таких угроз ключевой задачей является раннее обнаружение фишинговых веб-сайтов. Несмотря на то, что ранее были предложены различные машинные обучаемые модели, которые способны различать легитимные сайты от фишинговых, недостаточное внимание было уделено выбору эффективных признаков. Мы предлагаем новый подход, включающий в эти модели дополнительные ключевые слова, что позволяет улучшить их работу. #### Метод Мы предлагаем интегрировать ключевые слова из URL-адресов в существующие машинные обучаемые модели. Для этого мы разрабатываем алгоритм, который извлекает ключевые слова из URL-адресов и объединяет их с традиционными признаками, такими как длина URL-адреса, частота символов, и т.д. Наша методика может быть использована для всех основных машинных обучаемых моделей, таких как линейный логистический регрессор, SVM и др. Мы приводим эксперименты с разными наборами данных и показываем, что наш подход снижает ошибку классификации на 30% для больших данных и даже более существенно — для малых наборов. Для получения результатов мы используем множество машинных обучаемых моделей, включая линейный регрессор, SVM и другие. #### Результаты Мы проводим эксперименты с разными машинными обучаемыми моделями, включая линейный логистический регрессор, SVM, рукописный регрессор и др. Эксперименты проводятся на разных наборах данных, включая большие и малые. Наши результаты показывают, что применение нашего метода может снизить ошибку классификации на 30% для больших наборов данных. Эффект значительнее для малых наборов данных. Мы получаем достижение точности 99,68% при использовании лучшей модели. Кроме того, наш алгоритм не требует дополнительных данных из сторонних источников, что делает его более универсальным. #### Значимость Метод, предложенный в нашей работе, может применяться в различных областях безопасности, в том числе для защиты пользователей от фишинга. Он показывает высокую точность, даже при работе с небольшими наборами данных. Важно отметить, что наша методика не зависит от сторонних сервисов и полагается только на данные, извлекаемые из URL-адреса. Это делает её эффективной и простую в реализации. Мы считаем, что наш подход может быть использован в дальнейшем для улучшения других алго

Annotation:

Recently, we can observe a significant increase of the phishing attacks in the Internet. In a typical phishing attack, the attacker sets up a malicious website that looks similar to the legitimate website in order to obtain the end-users' information. This may cause the leakage of the sensitive information and the financial loss for the end-users. To avoid such attacks, the early detection of these websites' URLs is vital and necessary. Previous researchers have proposed many machine learning al...

ID: 2508.09765v1 cs.CR, cs.AI, cs.LG, cs.NE

arXiv PDF

📄 Towards Scalable Lottery Ticket Networks using Genetic Algorithms

2025-08-14

Авторы:

Julian Schönberger, Maximilian Zorn, Jonas Nüßlein, Thomas Gabor, Philipp Altmann

## Контекст В современных глубоких нейронных сетях, достижение высокой эффективности часто конфликтует с требованиями к сложности модели и потреблению ресурсов. Обычной практикой является тренировка обширных сетей и применение методов сжатия, но это может быть ресурсоемко. Новые подходы, такие как гипотеза сильных билетов (Strong Lottery Ticket Hypothesis), предлагают альтернативу: нахождение подсетей в случайно инициализированных, переопределенных моделях, которые могут демонстрировать точность, аналогичную тренированной модели, но с значительно меньшим числом параметров. Этот подход не только экономит ресурсы, но и упрощает развертывание моделей в реальных ситуациях. Наша работа фокусируется на применении генетических алгоритмов для поиска таких подсетей, что позволяет устранить необходимость использования градиентных методов. ## Метод Мы предлагаем использовать генетические алгоритмы для поиска "сильных билетов" (strong lottery tickets) в моделях. Наша методология включает следующие шаги: 1. **Инициализация**: Начинаем с случайно инициализированной нейросети. 2. **Фитнес-функция**: Определяем метрики, по которым будет оцениваться качество подсети, такие как точность и степень уплотнения (sparsity). 3. **Генетический процесс**: Мы используем селекцию, мутацию и повторную генерацию для изменения подсети, чтобы улучшить ее метрики. 4. **Оценка**: После каждого цикла проверяем подсеть на соответствие заданному критерию. 5. **Сравнение**: Наши результаты сравниваются с нынешней литературой, используя точность и степень уплотнения как основные метрики. Мы применяем этот подход к бинарным и многоклассовым классификационным задачам, оптимизируя сети без использования градиентных методов, что делает нашу методику более эффективной и универсальной. ## Результаты Мы проверили наш подход на нескольких классических датасетах, таких как MNIST и CIFAR-10. Наши результаты показывают, что: - Наш подход демонстрирует **высокую точность**, которая в некоторых случаях превосходит стандартные методы. - Мы добились **высокой степени уплотнения**, позволяющей значительно сократить число параметров без потери качества. - Результаты показали, что наши подсети могут быть **удобно развернуты на реальных устройствах**, где ресурсы ограничены. - Мы также отметили, что универсальность нашего подхода позволяет применять его к различным типам задач, включая регрессию. ## Значимость Наш подход имеет широкие возможности применения в следующих областях: - **Мобильные приложения**: Такие приложения часто ограничены по размеру моделей и производите

Annotation:

Building modern deep learning systems that are not just effective but also efficient requires rethinking established paradigms for model training and neural architecture design. Instead of adapting highly overparameterized networks and subsequently applying model compression techniques to reduce resource consumption, a new class of high-performing networks skips the need for expensive parameter updates, while requiring only a fraction of parameters, making them highly scalable. The Strong Lotter...

ID: 2508.08877v1 cs.LG, cs.NE

arXiv PDF

📄 Symbolic Quantile Regression for the Interpretable Prediction of Conditional Quantiles

2025-08-13

Авторы:

Cas Oude Hoekstra, Floris den Hengst

## Контекст Говорящий английский Область исследований в этих работах относится к методам символической регрессии (SR), которые используются для создания прозрачных (white-box) моделей предсказания. Хотя SR была успешно применена для предсказания среднего значения результата, её применение для оценки влияния предикторов на различные точки распределения целевой переменной, таких как медиана или экстремальные значения, остается недостаточно изученным. Такие оценки являются критически важными в приложениях, где необходима полная интерпретируемость модели, например, в области безопасности и критически важных решений. Целью данного исследования является разработка подхода, позволяющего применять символическую регрессию для предсказания кондідциональных квантилей (quantiles), что позволит получить более полное понимание влияния предикторов на различные точки распределения. ## Метод Разработанный подход, названный Symbolic Quantile Regression (SQR), основывается на символической регрессии для предсказания кондициональных квантилей. SQR использует методы символического уравнения для описания зависимости между предикторами и кондициональными квантилями целевой переменной. Методология включает ряд технических решений, таких как использование динамического программирования для поиска лучших уравнений, а также применение градиентного спуска для оптимизации параметров. Архитектура SQR основывается на применении символического уравнения для каждого кондиционального квантиля, что позволяет получить более точные и интерпретируемые предсказания в разных точках распределения целевой переменной. ## Результаты В ходе экспериментов был проведен сравнительный анализ SQR с другими моделями, включая транспарентные модели и красный-бокс-бейзлайн. Результаты показали, что SQR превосходит транспарентные модели и показывает почти одинаковую точность с бейзлайном, не уступая ему в прозрачности. Был проведен выбор набора данных, включающий пример авиационного транспорта, где было показано, как SQR может объяснить различия в распределении целевой переменной, в частности, влияние предикторов на разные квантили распределения. Эти результаты подтверждают, что SQR является высокоточной и прозрачной моделью для предсказания кондициональных квантилей и понимания взаимосвязей в данных. ## Значимость Полученный подход имеет широкое применение в ситуациях, где необходимо понимание как среднего, так и экстремальных результатов, что важно в здравоохранении, финансах и инженерных приложениях. Одним из основных преимуществ SQR является его прозрачность, что позволяет пользователю понять, как именно каждый предиктор влияет на ра

Annotation:

Symbolic Regression (SR) is a well-established framework for generating interpretable or white-box predictive models. Although SR has been successfully applied to create interpretable estimates of the average of the outcome, it is currently not well understood how it can be used to estimate the relationship between variables at other points in the distribution of the target variable. Such estimates of e.g. the median or an extreme value provide a fuller picture of how predictive variables affect...

ID: 2508.08080v1 cs.LG, cs.NE, stat.AP

arXiv PDF

📄 SCAR: State-Space Compression for AI-Driven Resource Management in 6G-Enabled Vehicular Infotainment Systems

2025-08-12

Авторы:

Ioan-Sorin Comsa, Purav Shah, Karthik Vaidhyanathan, Deepak Gangadharan, Christof Imhof, Per Bergamin, Aryan Kaushik, Gabriel-Miro Muntean, Ramona Trestian

Область исследования: Исследование сосредоточено на развитии новых методов управления ресурсами в сетях 6G, особенно в контексте автономных и гибридных систем. Акцент делается на адаптации Radio Resource Management (RRM) для обеспечения эффективности и справедливости в условиях повышенного набора данных, который приходит от самоуправляющих транспортных средств. SCAR (State-Space Compression for AI-Driven Resource Management) предлагает решение для этих вызовов, используя компрессию данных и AI-приложения. ## Контекст Развитие 6G-сетей приносит новые возможности для улучшения информационных систем в транспортных средствах. Традиционные RRM-техники становятся неэффективными при увеличении объема данных, таких как Channel Quality Indicators (CQI), от автономных автомобилей. Данная проблема влечет за собой нехватку ресурсов для эффективного управления сетью и несправедливость в распределении ресурсов. SCAR предлагает новый подход, комбинируя AI и методы компрессии, для повышения эффективности и справедливости в 6G-решениях. ## Метод SCAR использует грамотное сжатие данных CQI с помощью методов машинного обучения, включая кластеризацию и Radial Basis Function (RBF) сети. Эти сжатые данные становятся входными для 6G-ориентированных алгоритмов Reinforcement Learning (RL), которые оптимизируют ресурсное управление, максимизируя пропускную способность и соблюдая справедливость в распределении, заданную NGMN. Используется Simulated Annealing with Stochastic Tunneling (SAST) для эффективного кластеризации CQI. ## Результаты Проведенные эксперименты показали, что SCAR увеличивает время нахождения в оптимальных регионах распределения ресурсов на 14% и сокращает время несправедливого распределения на 15% в сравнении с RL-базированными без сжатия данных. Эффективность сжатия CQI достигается за счет Simulated Annealing with Stochastic Tunneling (SAST)-based clustering, который снижает разброс в данных на 10%. Эти результаты подтверждают высокую эффективность SCAR в условиях динамического взаимодействия сетей. ## Значимость SCAR является перспективным решением для управления ресурсами в сетях 6G, особенно в сфере транспортных систем. Он повышает пропускную способность и достигает справедливости в распределении ресурсов. Эти достижения могут применяться в различных 6G-приложениях, включая самоуправляющие транспортные средства и улучшенные системы взаимодействия. Будущие исследования будут сфокусированы на улучшении методов компрессии и расширении приложений в динамических сетевых условиях. ## Выводы SCAR демонстрирует высокую эффективность в управлении ресурсами в условиях динамического транспортного окружения, оптимизируя пропускну

Annotation:

The advent of 6G networks opens new possibilities for connected infotainment services in vehicular environments. However, traditional Radio Resource Management (RRM) techniques struggle with the increasing volume and complexity of data such as Channel Quality Indicators (CQI) from autonomous vehicles. To address this, we propose SCAR (State-Space Compression for AI-Driven Resource Management), an Edge AI-assisted framework that optimizes scheduling and fairness in vehicular infotainment. SCAR em...

ID: 2508.06243v1 cs.LG, cs.NE, cs.SY, eess.SY

arXiv PDF

1
2
5
6
7
8

Показано 61 - 70 из 74 записей