NEFMind: Parameter-Efficient Fine-Tuning of Open-Source LLMs for Telecom APIs Automation
2508.09240v1
cs.NI, cs.AI, cs.CL
2025-08-15
Авторы:
Zainab Khan, Ahmed Hussain, Mukesh Thakur, Arto Hellas, Panos Papadimitratos
Резюме на русском
## Контекст
Современная телекоммуникационная система строится на **Service-Based Architecture (SBA)**, в которой выделяются сложности в управлении **Network Functions (NFs)** и **Application Programming Interfaces (APIs)**. Эти сложности включают в себя увеличение количества NFs, необходимость быстрого обнаружения и управления API, а также увеличение объема данных, которые должны быть обнаружены и обработаны. Эти факторы становятся главными вызовами для оптимизации в телекоммуникационных сетях, особенно при развитии **5G Service-Based Architecture (SBA)**. Одной из основных проблем является **communication overhead** – высокая стоимость поддержки и обнаружения API, которая может быть повлияна на производительность и удобство использования системы. Наша мотивация заключается в разработке единого фреймворка, который будет упростить процессы обнаружения и управления API, снизив тем самым **communication overhead** и улучшив общую эффективность системы.
## Метод
Мы предлагаем **NEFMind**, фреймворк, который использует **parameter-efficient fine-tuning** открытых **Large Language Models (LLMs)**. Наша методология включает в себя следующие шаги:
1. **Синтетическая генерация данных**: Мы используем **NEF API specifications** для синтетического создания данных, которые могут быть использованы в обучении модели. Это позволяет генерировать богатый набор данных для тренировки модели, чтобы увеличить ее точность и обнаружить возможные сценарии.
2. **Оптимизация модели**: Мы используем **Quantized-Low-Rank Adaptation (QLRA)** – метод оптимизации, который позволяет уменьшить размер модели без значительной потери в точности. Это позволяет модели работать в реальном времени, не требуя больших ресурсов.
3. **Performance Evaluation**: Мы оцениваем результаты модели с помощью **GPT-4 Ref Score** и **BertScore**, которые позволяют проверить качество генерируемых ответов и точность обнаружения API.
## Результаты
Мы проводили эксперименты с **Phi-2 model**, который был оптимизирован с помощью нашей стратегии **NEFMind**. Результаты показали высокую точность в **98-100%** для обнаружения API-вызовов в **5G Service-Based Architecture (SBA)**. Мы также сравнили нашу модель с **GPT-4**, и наша модель показала **85%** снижения **communication overhead** в сравнении с ручным обнаружением API. Это свидетельствует о том, что модель **Phi-2** может эффективно заменить более крупные модели без потери в качестве.
## Значимость
**NEFMind** может применяться в различных областях, включая **automation of telecom APIs**, **5G networks management** и **service discovery в сервисно-ориентированных архитектурах**. Наше решение обеспечивает:
- **Снижение overhead communication**: Мы уменьшили затраты на обнаружение и управление API, что может повысить производительность и экономичность системы.
- **Увеличение эффективности**: Использование оптимизированных моделей позволяет экономить ресурсы, что является ключевым для сетей с высоким объем
Abstract
The use of Service-Based Architecture in modern telecommunications has
exponentially increased Network Functions (NFs) and Application Programming
Interfaces (APIs), creating substantial operational complexities in service
discovery and management. We introduce \textit{NEFMind}, a framework leveraging
parameter-efficient fine-tuning of open-source Large Language Models (LLMs) to
address these challenges. It integrates three core components: synthetic
dataset generation from Network Exposure Function (NEF) API specifications,
model optimization through Quantized-Low-Rank Adaptation, and performance
evaluation via GPT-4 Ref Score and BertScore metrics. Targeting 5G
Service-Based Architecture APIs, our approach achieves 85% reduction in
communication overhead compared to manual discovery methods. Experimental
validation using the open-source Phi-2 model demonstrates exceptional API call
identification performance at 98-100% accuracy. The fine-tuned Phi-2 model
delivers performance comparable to significantly larger models like GPT-4 while
maintaining computational efficiency for telecommunications infrastructure
deployment. These findings validate domain-specific, parameter-efficient LLM
strategies for managing complex API ecosystems in next-generation
telecommunications networks.
Ссылки и действия
Дополнительные ресурсы: