Prediction, Generation of WWTPs microbiome community structures and Clustering of WWTPs various feature attributes using DE-BP model, SiTime-GAN model and DPNG-EPMC ensemble clustering algorithm with modulation of microbial ecosystem health

2509.01526v1 cs.LG, cs.NE 2025-09-05
Авторы:

Mingzhi Dai, Weiwei Cai, Xiang Feng, Huiqun Yu, Weibin Guo, Miao Guo

Резюме на русском

## Контекст Активированный серый песок (AS) широко используется в водоочистке для удаления полимеров и микробиологических элементов. Однако обработка AS с помощью микробного разложения требует понимания микробиологических сообществ в этих системах. Микробиомы играют ключевую роль в глобальных биогеохимических циклах и во взаимодействии между природными и инженерными системами. Несмотря на их важность, микробиомы остаются трудными для контроля и модификации в целях улучшения условий их эксплуатации. Особенно сложно это становится в сложных системах, таких как отходы от технологических процессов. Улучшение микробиологического контроля может привести к значительным повышениям эффективности водоочистки. Таким образом, целью данной работы является разработка модели для прогнозирования микробиологического состава AS, а также разработка методов кластеризации для анализа различных атрибутов WWTP, которые влияют на состояние микробиологического экосистемы. ## Метод Мы разработали модель DE-BP, основанную на сети глубокого обучения с подкреплением дифференциальной эволюцией (DE), для прогнозирования состава микробиологических сообществ AS в системах водоочистки. Модель оптимизирована для точного прогнозирования состава микробиологических сообществ в системах AS, собранных из WWTP по всему миру. Для кластеризации атрибутов WWTP мы предложили новую модель DPNG-EPMC, работающую на основе эмоциональной преференции и директивного положения. Кроме того, мы использовали SiTime-GAN, современную модель генерирующую адверсарную сеть, для генерирования новых микробиологических структур и атрибутов данных. Эти модели позволяют проанализировать и моделировать микробиологические сообщества, а также рассмотреть их влияние на состояние микробиологической экосистемы в WWTP. ## Результаты Мы провели эксперименты на данных, собранных из различных WWTP, используя DE-BP для прогнозирования состава микробиологических сообществ. Модель показала высокую точность прогнозирования. Далее, мы применили DPNG-EPMC для кластеризации атрибутов WWTP, включая качество воды, показатели выбросов и другие факторы, влияющие на процесс водоочистки. Наконец, мы использовали SiTime-GAN для генерирования и модификации микробиологических данных. Эти эксперименты показали, что DE-BP может предсказывать состав микробиологических сообществ с большей точностью, чем существующие модели. Кроме того, DPNG-EPMC доказал эффективность в анализе различных атрибутов WWTP, влияющих на микробиологическое состояние. Генеративная модель SiTime-GAN

Abstract

Microbiomes not only underpin Earth's biogeochemical cycles but also play crucial roles in both engineered and natural ecosystems, such as the soil, wastewater treatment, and the human gut. However, microbiome engineering faces significant obstacles to surmount to deliver the desired improvements in microbiome control. Here, we use the backpropagation neural network (BPNN), optimized through differential evolution (DE-BP), to predict the microbial composition of activated sludge (AS) systems collected from wastewater treatment plants (WWTPs) located worldwide. Furthermore, we introduce a novel clustering algorithm termed Directional Position Nonlinear Emotional Preference Migration Behavior Clustering (DPNG-EPMC). This method is applied to conduct a clustering analysis of WWTPs across various feature attributes. Finally, we employ the Similar Time Generative Adversarial Networks (SiTime-GAN), to synthesize novel microbial compositions and feature attributes data. As a result, we demonstrate that the DE-BP model can provide superior predictions of the microbial composition. Additionally, we show that the DPNG-EPMC can be applied to the analysis of WWTPs under various feature attributes. Finally, we demonstrate that the SiTime-GAN model can generate valuable incremental synthetic data. Our results, obtained through predicting the microbial community and conducting analysis of WWTPs under various feature attributes, develop an understanding of the factors influencing AS communities.

Ссылки и действия