HealthSLM-Bench: Benchmarking Small Language Models for Mobile and Wearable Healthcare Monitoring
2509.07260v1
cs.AI, cs.HC, cs.LG
2025-09-11
Авторы:
Xin Wang, Ting Dang, Xinyu Zhang, Vassilis Kostakos, Michael J. Witbrock, Hong Jia
Резюме на русском
## Контекст
Mobile и wearable healthcare monitoring (МХЗ и ОХЗ мониторинг) являются критически важными для обнаружения заболеваний, управления хроническими болезнями и улучшения качества жизни. Исследования, основанные на больших языковых моделях (LLMs), показали выдающиеся результаты в предсказании здоровья. Однако, большинство LLM-подобных решений являются облачными, что приводит к затруднениям в обеспечении конфиденциальности, повышению затрат памяти и увеличению задержки. Чтобы решить эти проблемы, появилась интерес к мелким языковым моделям (SLMs), которые являются эффективными, могут работать локально на мобильных и носимых устройствах. Несмотря на это, их реальность в здравоохранении остается под вопросом. Целью данного исследования является оценка их возможностей в задачах предсказания здоровья, используя нулевой, несколько и инструкционный подходы к оптимизации.
## Метод
Методология основывалась на системной оценке SLMs с помощью различных подходов: нулевой, несколько и инструкционной оптимизации. Для сравнения использовались не только текущие решения LLM, но и новые SLM-подходы. Данные были сгенерированы из медицинских баз и устройств, предоставив обширный набор данных для моделирования. Оценка включала в себя метрики точности, достоверности и эффективности. Тестирование было проведено как в условиях лаборатории, так и на реальных мобильных устройствах, чтобы оценить реальность использования.
## Результаты
Исследования показали, что SLMs могут достигать точность, близкую к LLM, при наличии достаточного количества данных. В нулевом и нескольких подходах SLMs показали высокий уровень точности при предсказании здоровья, но в некоторых случаях их результаты ниже, чем у LLM. Особенно удачными были результаты в оптимизации в сценариях с малой выборкой данных. На мобильных устройствах SLMs продемонстрировали эффективность, низкую задержку и значительное увеличение конфиденциальности по сравнению с облачными LLM-решениями.
## Значимость
Результаты имели большое значение в области здравоохранения. SLMs могут применяться в системах мониторинга здоровья на мобильных устройствах, позволяя реализовать в реальном времени анализ и предсказание здоровья. Это значительно оптимизирует ресурсы, гарантирует большую конфиденциальность и предоставляет более доступные решения для широкой аудитории. Однако, остаются проблемы, такие как несоответствие в низких затратах для малой выборки и трудности с классом несбалансированных данных.
## Выводы
SLMs доказали свою эффективность в сфере здравоохранения, демонстрируя высокую точность и эффе
Abstract
Mobile and wearable healthcare monitoring play a vital role in facilitating
timely interventions, managing chronic health conditions, and ultimately
improving individuals' quality of life. Previous studies on large language
models (LLMs) have highlighted their impressive generalization abilities and
effectiveness in healthcare prediction tasks. However, most LLM-based
healthcare solutions are cloud-based, which raises significant privacy concerns
and results in increased memory usage and latency. To address these challenges,
there is growing interest in compact models, Small Language Models (SLMs),
which are lightweight and designed to run locally and efficiently on mobile and
wearable devices. Nevertheless, how well these models perform in healthcare
prediction remains largely unexplored. We systematically evaluated SLMs on
health prediction tasks using zero-shot, few-shot, and instruction fine-tuning
approaches, and deployed the best performing fine-tuned SLMs on mobile devices
to evaluate their real-world efficiency and predictive performance in practical
healthcare scenarios. Our results show that SLMs can achieve performance
comparable to LLMs while offering substantial gains in efficiency and privacy.
However, challenges remain, particularly in handling class imbalance and
few-shot scenarios. These findings highlight SLMs, though imperfect in their
current form, as a promising solution for next-generation, privacy-preserving
healthcare monitoring.
Ссылки и действия
Дополнительные ресурсы: