Identifying and Addressing User-level Security Concerns in Smart Homes Using "Smaller" LLMs
2509.19485v1
cs.CR, cs.AI
2025-09-26
Авторы:
Hafijul Hoque Chowdhury, Riad Ahmed Anonto, Sourov Jajodia, Suryadipta Majumdar, Md. Shohrab Hossain
Резюме на русском
## Контекст
Со взрывом популярности Интернета вещей (IoT) в мире умных домов, пользователи становятся все более вовлеченными в процесс управления и мониторингом своих устройств. Однако это сопряжено с новыми безопасностными вызовами. Несмотря на возможности технологий, пользователи часто остаются без ответа на вопросы о безопасности, особенно когда они используют устройства с подключением к интернету. Они должны ориентироваться в технических справочниках и блогах, что затрудняет обращение к специалистам. Такая ситуация создает риск создания угроз для безопасности умных домов. Мы предлагаем исследовать существующие проблемы безопасности умных домов, чтобы разработать более эффективные и доступные решения.
## Метод
Мы разработали специальный набор данных, основанный на вопросах и ответах из открытых источников, который отражает практические проблемы безопасности умных домов. Используя LDA (Latent Dirichlet Allocation), мы извлекали основные темы безопасности, чтобы понять, на какие вопросы пользователи чаще всего хотят получить ответы. Для решения проблемы мы использовали небольшие трансформерные модели, такие как T5 и Flan-T5, которые были приспособлены к нашему набору данных. Наш подход отличается от использования больших моделей, таких как GPT и Gemini, которые требуют больших ресурсов и включают в себя данные об обучении. Наша модель трансформера отличается компактностью, чтобы ее можно было легко развернуть в умных домах, где ресурсы компьютерной техники ограничены.
## Результаты
Мы провели эксперименты с нашим модельным подходом, используя реальные вопросы пользователей, связанные с безопасностью умных домов. Были проведены измерения точности и скорости ответа, а также проанализированы результаты по сравнению с традиционными моделями. Мы обнаружили, что наша модель дает более точные и относительно быстрые ответы, что значительно улучшает пользовательский опыт. Это проявляется в том, что пользователи могут более точно и быстро обращаться к решениям проблем безопасности, в том числе с подключением к интернету. Значительная часть вопросов, на которые были даны ответы, связана с проблемами доступа, конфиденциальностью и целостностью.
## Значимость
Наш подход может применяться в различных сферах, где пользователи домашних Интернет-устройств нуждаются в безопасности и конфиденциальности. Мы можем использовать нашу модель для обеспечения доступности и безопасности, а также для создания более эффективных решений в области Интернета вещей. Это включает в себя улучшение безопасности и у
Abstract
With the rapid growth of smart home IoT devices, users are increasingly
exposed to various security risks, as evident from recent studies. While
seeking answers to know more on those security concerns, users are mostly left
with their own discretion while going through various sources, such as online
blogs and technical manuals, which may render higher complexity to regular
users trying to extract the necessary information. This requirement does not go
along with the common mindsets of smart home users and hence threatens the
security of smart homes furthermore. In this paper, we aim to identify and
address the major user-level security concerns in smart homes. Specifically, we
develop a novel dataset of Q&A from public forums, capturing practical security
challenges faced by smart home users. We extract major security concerns in
smart homes from our dataset by leveraging the Latent Dirichlet Allocation
(LDA). We fine-tune relatively "smaller" transformer models, such as T5 and
Flan-T5, on this dataset to build a QA system tailored for smart home security.
Unlike larger models like GPT and Gemini, which are powerful but often resource
hungry and require data sharing, smaller models are more feasible for
deployment in resource-constrained or privacy-sensitive environments like smart
homes. The dataset is manually curated and supplemented with synthetic data to
explore its potential impact on model performance. This approach significantly
improves the system's ability to deliver accurate and relevant answers, helping
users address common security concerns with smart home IoT devices. Our
experiments on real-world user concerns show that our work improves the
performance of the base models.
Ссылки и действия
Дополнительные ресурсы: