Identifying and Addressing User-level Security Concerns in Smart Homes Using "Smaller" LLMs

2509.19485v1 cs.CR, cs.AI 2025-09-26

Авторы:

Hafijul Hoque Chowdhury, Riad Ahmed Anonto, Sourov Jajodia, Suryadipta Majumdar, Md. Shohrab Hossain

Резюме на русском

## Контекст Со взрывом популярности Интернета вещей (IoT) в мире умных домов, пользователи становятся все более вовлеченными в процесс управления и мониторингом своих устройств. Однако это сопряжено с новыми безопасностными вызовами. Несмотря на возможности технологий, пользователи часто остаются без ответа на вопросы о безопасности, особенно когда они используют устройства с подключением к интернету. Они должны ориентироваться в технических справочниках и блогах, что затрудняет обращение к специалистам. Такая ситуация создает риск создания угроз для безопасности умных домов. Мы предлагаем исследовать существующие проблемы безопасности умных домов, чтобы разработать более эффективные и доступные решения. ## Метод Мы разработали специальный набор данных, основанный на вопросах и ответах из открытых источников, который отражает практические проблемы безопасности умных домов. Используя LDA (Latent Dirichlet Allocation), мы извлекали основные темы безопасности, чтобы понять, на какие вопросы пользователи чаще всего хотят получить ответы. Для решения проблемы мы использовали небольшие трансформерные модели, такие как T5 и Flan-T5, которые были приспособлены к нашему набору данных. Наш подход отличается от использования больших моделей, таких как GPT и Gemini, которые требуют больших ресурсов и включают в себя данные об обучении. Наша модель трансформера отличается компактностью, чтобы ее можно было легко развернуть в умных домах, где ресурсы компьютерной техники ограничены. ## Результаты Мы провели эксперименты с нашим модельным подходом, используя реальные вопросы пользователей, связанные с безопасностью умных домов. Были проведены измерения точности и скорости ответа, а также проанализированы результаты по сравнению с традиционными моделями. Мы обнаружили, что наша модель дает более точные и относительно быстрые ответы, что значительно улучшает пользовательский опыт. Это проявляется в том, что пользователи могут более точно и быстро обращаться к решениям проблем безопасности, в том числе с подключением к интернету. Значительная часть вопросов, на которые были даны ответы, связана с проблемами доступа, конфиденциальностью и целостностью. ## Значимость Наш подход может применяться в различных сферах, где пользователи домашних Интернет-устройств нуждаются в безопасности и конфиденциальности. Мы можем использовать нашу модель для обеспечения доступности и безопасности, а также для создания более эффективных решений в области Интернета вещей. Это включает в себя улучшение безопасности и у

Abstract

With the rapid growth of smart home IoT devices, users are increasingly exposed to various security risks, as evident from recent studies. While seeking answers to know more on those security concerns, users are mostly left with their own discretion while going through various sources, such as online blogs and technical manuals, which may render higher complexity to regular users trying to extract the necessary information. This requirement does not go along with the common mindsets of smart home users and hence threatens the security of smart homes furthermore. In this paper, we aim to identify and address the major user-level security concerns in smart homes. Specifically, we develop a novel dataset of Q&A from public forums, capturing practical security challenges faced by smart home users. We extract major security concerns in smart homes from our dataset by leveraging the Latent Dirichlet Allocation (LDA). We fine-tune relatively "smaller" transformer models, such as T5 and Flan-T5, on this dataset to build a QA system tailored for smart home security. Unlike larger models like GPT and Gemini, which are powerful but often resource hungry and require data sharing, smaller models are more feasible for deployment in resource-constrained or privacy-sensitive environments like smart homes. The dataset is manually curated and supplemented with synthetic data to explore its potential impact on model performance. This approach significantly improves the system's ability to deliver accurate and relevant answers, helping users address common security concerns with smart home IoT devices. Our experiments on real-world user concerns show that our work improves the performance of the base models.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Identifying and Addressing User-level Security Concerns in Smart Homes Using "Smaller" LLMs

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

A Light-Weight Large Language Model File Format for Highly-Secure Model Distribu...

SoK: a Comprehensive Causality Analysis Framework for Large Language Model Secur...

Hey GPT-OSS, Looks Like You Got It - Now Walk Me Through It! An Assessment of th...

Context-Aware Hierarchical Learning: A Two-Step Paradigm towards Safer LLMs

Large Language Model based Smart Contract Auditing with LLMBugScanner

Навигация