PEARL: Peer-Enhanced Adaptive Radio via On-Device LLM

2509.24085v1 cs.LG, cs.AI, cs.NI, eess.SP 2025-10-01
Авторы:

Ju-Hyung Lee, Yanqing Lu, Klaus Doppler

Резюме на русском

## Контекст PEARL (Peer-Enhanced Adaptive Radio via On-Device LLM) представляет собой рамфруметр для кооперативной кросс-леер-оптимизации в дивайс-то-дивайс (D2D) коммуникации. Он расширяет парадигму одиночных девайс-он-девайс LLMs, используя состояния как публишера, так и сабскрабера, чтобы указать параметры Wi-Fi Aware (WA). PEARL использует контекстно-зависимую награду, которая нормализует latency по приложениям и модулирует энергию, основываясь на состоянии батареи устройства. Это дает боRшее направление для улучшения Kullback-Leibler (KL)-основынного приближения. Оптимизированная архитектура LLMs позволяет решать проблемы взаимодействия устройств в реальном времени с низким латентом и энергоэффективностью. ## Метод PEARL использует рамфруметр, который объединяет состояния публишера и сабскрабера для более точной оптимизации параметров Wi-Fi Aware. Метод включает в себя контекстно-зависимую награду, которая нормализует latency для приложений и модифицирует энергию на основе состояния батареи. Для тюнинга используется KL-основанный подход. Для реализации две версии PEARL предлагаются: PEARL (со вторым слоем и LoRA) и PEARL-Lite (без второго слоя). Эти варианты позволяют достичь лучшей общей производительности и снизить затраты энергии при оптимальном обслуживании. ## Результаты PEARL протестирован в синтетических сценариях, основанных на настоящих измерениях. Он показал лучшую общую производительность по сравнению с гезистическими и компактными моделями, снизил энергозатраты до 16% в сценариях с низким зарядом батареи и достиг среднего латента в 20 мс. PEARL-Lite, хотя и не такой эффективен, при этом достигает почти одинаковых результатов с меньшим количеством параметров. Эти результаты демонстрируют, что PEARL эффективно применяется для реальных сетевых сценариев. ## Значимость PEARL может быть применен в различных сценариях D2D-коммуникации, где необходима эффективная оптимизация параметров. Его особенностью является более быстрая и энергоэффективная работа, что делает его привлекательным для сценариев с низким зарядом батареи. PEARL также может применяться в системах с ограниченными ресурсами и в реальном времени, что делает его полезным для многих аппаратных платформ. ## Выводы PEARL показал, что использование LLMs для контекстной оптимизации в D2D-коммуникации может повысить эффективность и энергосбережение. Будущие исследования будут фокусироваться на улучшении моделей, увеличении скорости работы и расширении области применения PEARL в различных сетевых средах.

Abstract

We present PEARL (Peer-Enhanced Adaptive Radio via On-Device LLM), a framework for cooperative cross-layer optimization in device-to-device (D2D) communication. Building on our previous work on single-device on-device LLMs, PEARL extends the paradigm by leveraging both publisher and subscriber states to guide Wi-Fi Aware (WA) parameter selection. A context-aware reward, which normalizes latency by application tolerances and modulates energy by device battery states, provides richer supervision for KL-based finetuning. We study two lightweight variants: PEARL (Head + Low-Rank Adaptation (LoRA)) achieves the best overall performance, while PEARL-Lite (Head-only) delivers sub-20 ms inference at near-identical objective scores. Across synthetic scenarios grounded in real measurements, PEARL improves objective scores over heuristic and compact model baselines and reduces energy by up to 16% in cooperative low-battery cases. These results demonstrate that peer-aware context, reward-aligned training, and head-based efficiency make LLMs practical for always-on, on-device cross-layer control.

Ссылки и действия