📊 Статистика дайджестов
Всего дайджестов: 34022 Добавлено сегодня: 0
Последнее обновление: сегодня
Авторы:
Towhidul Islam, Md Sumon Ali
#### Контекст
Ожирение является критическим мировым здравоохранным проблемой, вызванным разными факторами, включая диету, физиологию и окружающую среду. Это сильно связано с такими хроническими заболеваниями, как диабет, сердечно-сосудистые расстройства и рак. Машинное обучение предлагает перспективные возможности для раннего прогнозирования риска ожирения, но оценка различных методов машинного обучения в этой области остается недостаточной. Особенно недостаточно понятны преимущества гибридных методов голосования и стекирования, которые могут значительно улучшить достоверность и эффективность прогнозирования.
#### Метод
Для сравнительного анализа использовались два датасета, каждый из которых был обработан с целью обеспечения баланса и идентификации выбросов. Три метода машинного обучения — **Majority Hard Voting**, **Weighted Hard Voting** и **Stacking** с мета-классификатором Multi-Layer Perceptron — были протестированы на комбинации 9 машинных обучаемых моделей (таких как Логистическая регрессия, Дерево решений, Случайный лес), протестированных на 50 конфигураций гиперпараметров. Данные были предварительно обработаны для гарантии качества и соответствия моделям.
#### Результаты
На Dataset-1 оба гибридных метода — Weighted Hard Voting и Stacking — показали почти одинаковую эффективность, превосходя Majority Hard Voting. Stacking достигло Accuracy 0.920304 и F1-Score 0.920070, тогда как Majority Hard Voting показал Accuracy 0.914160 и F1-Score 0.914115. На Dataset-2 Stacking показал существенное преимущество, достигнув Accuracy 0.989837 и F1-Score 0.989825. Weighted Hard Voting достиг Accuracy 0.981707 и F1-Score 0.981675, тогда как Majority Hard Voting показал Accuracy 0.981707 и F1-Score 0.981675.
#### Значимость
Нахождение лучшего подхода к прогнозированию риска ожирения имеет критическое значение для раннего выявления и профилактики хронических заболеваний. Это исследование подтверждает, что Stacking является эффективнее для комплексных данных, в то время как Majority Hard Voting может служить достаточной альтернативой для простых случаев. Эти находки могут помочь в выборе наиболее подходящего метода для различных задач в здравоохранении.
#### Выводы
Гибридные методы голосования и стекирования демонстрируют свою эффективность в прогнозировании риска ожирения. Stacking доказал свою превосходность в сложных случаях, в то время как Majority Hard Voting может быть оптимальным для простых задач. Будущие исследования должны ориентироваться на уточнение гибридных моделей и их применение к более широкому спектру здравоохранения.
Annotation:
Obesity is a critical global health issue driven by dietary, physiological,
and environmental factors, and is strongly associated with chronic diseases
such as diabetes, cardiovascular disorders, and cancer. Machine learning has
emerged as a promising approach for early obesity risk prediction, yet a
comparative evaluation of ensemble techniques -- particularly hybrid majority
voting and ensemble stacking -- remains limited. This study aims to compare
hybrid majority voting and ensemble stacking...