OS-R1: Agentic Operating System Kernel Tuning with Reinforcement Learning

2508.12551v1 cs.LG, cs.AI, cs.OS, cs.SE 2025-08-20
Авторы:

Hongyu Lin, Yuchen Li, Haoran Luo, Kaichun Yao, Libo Zhang, Mingjie Xing, Yanjun Wu

Резюме на русском

## Контекст Linux kernel tuning является ключевым фактором для оптимизации производительности операционных систем. Однако существующие методы часто сталкиваются с проблемами эффективности, масштабируемости и общедоступности. Тем не менее, эффективное настройка ядра Linux может значительно повысить производительность системы и улучшить ее реакцию на изменения в рабочем окружении. Однако существующие методы часто не могут быстро адаптироваться к различным задачам или условиям работы, что негативно сказывается на их универсальности и эффективности. Это ставит перед исследователями задачу разработки методов, которые могут эффективно использоваться в различных сценариях. Развитие новых методологий в этой области может способствовать улучшению производительности компьютерных систем, уменьшению затрат на манипуляции с ядром и увеличению универсальности решений. ## Метод Для развития нового подхода в Linux kernel tuning разработана методология, основанная на использовании reinforcement learning (RL) и правильного определения целей. Операционная система интерпретируется как окружение, в котором работает RL-агент. Агент выбирает настройки, оптимизируя производительность системы. Для того, чтобы обеспечить быструю и грамотную настройку, используется д DEEP Q-NETWORKING (DQN), которая позволяет значительно уменьшить проблемы с эффективностью и скоростью настройки. Более того, в качестве целей используются новые reward functions, которые помогают улучшить точность настройки и системное восприятие работы. Также введена двухфазная процедура тренировки, которая ускоряет конвергенцию и уменьшает время, необходимое для переобучения в различных сценариях. Такой подход позволяет максимально эффективно использовать машинное обучение для настройки ядра Linux. ## Результаты Проведенные эксперименты показали, что новый подход OS-R1 реализует более высокую эффективность по сравнению с базовыми методами. Было показано, что OS-R1 улучшает производительность системы на до 5.6%, в то время как базовые методы эффективны только в некоторых сценариях. Особое внимание уделяется данности и гибкости решения. Оно показало себя эффективно в различных сценариях и приложениях. Помимо этого, OS-R1 показал высокую данность, что позволяет использовать его в реальных условиях без значительных дополнительных затрат на обучение. Эти результаты подтверждают высокую эффективность нового подхода в области Linux kernel tuning. ## Значимость Благодаря новому подходу можно формировать более эффективные и универсальные решения для Linux kernel tuning. Это может быть использовано в различных областях, включая облачные технологии, сетевые решения

Abstract

Linux kernel tuning is essential for optimizing operating system (OS) performance. However, existing methods often face challenges in terms of efficiency, scalability, and generalization. This paper introduces OS-R1, an agentic Linux kernel tuning framework powered by rule-based reinforcement learning (RL). By abstracting the kernel configuration space as an RL environment, OS-R1 facilitates efficient exploration by large language models (LLMs) and ensures accurate configuration modifications. Additionally, custom reward functions are designed to enhance reasoning standardization, configuration modification accuracy, and system performance awareness of the LLMs. Furthermore, we propose a two-phase training process that accelerates convergence and minimizes retraining across diverse tuning scenarios. Experimental results show that OS-R1 significantly outperforms existing baseline methods, achieving up to 5.6% performance improvement over heuristic tuning and maintaining high data efficiency. Notably, OS-R1 is adaptable across various real-world applications, demonstrating its potential for practical deployment in diverse environments. Our dataset and code are publicly available at https://github.com/LHY-24/OS-R1.

Ссылки и действия