Agentic AI Reasoning for Mobile Edge General Intelligence: Fundamentals, Approaches, and Directions
2509.23248v1
cs.AI, cs.NI
2025-10-01
Авторы:
Mingyi Luo, Ruichen Zhang, Xiangwang Hou, Jun Du, Chunxiao Jiang, Yong Ren, Dusit Niyato, Shiwen Mao
Резюме на русском
## Контекст
В последнее десятилетие, искусственный интеллект (AI) получил значительный прорыв, особенно благодаря развитию больших языковых моделей (LLMs). Эти модели внедрили сильные возможности логического вывода и автономного принятия решений. Однако, вопреки их мощи, LLMs часто ограничены вычислительными ресурсами и проблемами конфиденциальности данных.
Под концепцией Mobile Edge General Intelligence (MEGI) подразумевается использование вычислительных возможностей сетевого края для поддержки реального времени и защищенного от третьих сторон вывода. Интеграция LLMs с MEGI-средами представляет собой перспективное направление для создания систем с агентским поведением, которые могут выполнять современные задачи умных сетей, включая мобильное облачное технологирование, автоматизированное управление и распределенные системы мониторинга.
Однако, внедрение LLMs в MEGI-среды сталкивается с рядом проблем. Одной из главных проблем является высокая нагрузка на вычислительные ресурсы, а также трудности в обеспечении эффективности и защиты данных в пределах медийных и граничных сетей. Наша исследовательская группа разработала новый подход к развертыванию LLM-based agentic AI в MEGI-средах, который ориентирован на решение этих проблем.
## Метод
Мы предлагаем распределенную систему, в которой расширенные модели логического вывода используются для улучшения реального времени и автономных решений. Методология включает в себя несколько технических решений, такие как многоэкспертная модель (MoE) и адаптивная цепочка мыслей (CoT).
Схема работы нашей системы заключается в следующем:
1. **Адаптивное управление выводом**: Мы разработали алгоритм, который автоматически подбирает наиболее подходящую модель на основе задачи, которую необходимо решить.
2. **Многоэкспертная архитектура**: Мы разделили задачи на несколько подзадач, которые могут быть распределены по разным устройствам.
3. **Оптимизация вычислительных ресурсов**: Мы разработали методы, которые оптимизируют использование вычислительных ресурсов в зависимости от нагрузки и требований задачи.
Эти техники позволяют наший подход эффективно использовать вычислительные ресурсы и обеспечивают высокую скорость реагирования, которая необходима для решения реальных проблем в MEGI.
## Результаты
Мы провели эксперименты в реальной MEGI-среде, используя наши алгоритмы для различных задач, включая обработку естественного языка и анализ данных. Мы сравнили результаты с другими подходами, и результаты показали, что наш подход эффективно работает в условиях ограниченных ресурсов, обеспечивая высокую скорость реагирования и высо
Abstract
The rapid advancement of large language models (LLMs) has enabled an
emergence of agentic artificial intelligence (AI) with powerful reasoning and
autonomous decision-making capabilities. This integration with edge computing
has led to the development of Mobile Edge General Intelligence (MEGI), which
brings real-time, privacy-preserving reasoning to the network edge. However,
deploying LLM-based agentic AI reasoning in MEGI environments poses significant
challenges due to the high computational demands of reasoning and the limited
resources of edge devices. To address these challenges, we propose a joint
optimization framework for efficient LLM reasoning deployment in MEGI. First,
we review methods that enhance LLM reasoning capabilities, such as
Chain-of-Thought (CoT) prompting, Supervised Fine-Tuning (SFT), and Mixture of
Experts (MoE). Next, we present a distributed framework that addresses two
correlated aspects: reasoning enhancement through adaptive CoT prompting and
scalable deployment through distributed MoE architecture. The framework
dynamically activates expert networks and adjusts reasoning depth based on task
complexity and device capabilities. We further conduct experimental evaluations
in mobile edge environments. Experimental results demonstrate the framework's
effectiveness in balancing reasoning quality with resource efficiency,
validating the practical viability of deploying sophisticated LLM reasoning
capabilities in resource-constrained MEGI environments.
Ссылки и действия
Дополнительные ресурсы: