AQUAIR: A High-Resolution Indoor Environmental Quality Dataset for Smart Aquaculture Monitoring
2509.24069v1
cs.LG, cs.AI, cs.CV, stat.AP, 62M10, 68T45, 62P35, 92C40, 65C20, 60G35, 92C42, 92C35, 93E10, I.2.6; C.2.4; H.3.4; I.2.4; H.3.5; C.2.4; C.3; I.4.8; I.5.1; J.3;
K.6.1; H.2.8
2025-10-01
Авторы:
Youssef Sabiri, Walid Houmaidi, Ouail El Maadi, Yousra Chtouki
Резюме на русском
## Контекст
Область мониторинга внутренней среды в акклемерационных системах рыбного выращивания является ключевой для обеспечения стабильности процессов и минимизации воздействия человека на животных. Несмотря на возможности современных технологий, существуют значительные проблемы, связанные с недостатком открытых данных о внутренней среде, которые необходимы для развития алгоритмов предсказания и обнаружения аномалий. Эти проблемы влияют на развитие систем автоматизированного управления и оптимизации внутренней среды. Для адресации этой проблемы необходимо создание открытого доступа к богатым данным, позволяющим создавать и тестировать различные модели.
## Метод
Для заполнения пробела в открытых данных разработана AQUAIR, открытая публичная база данных, содержащая данные о внутренней среде вокруг интерьера рыбного бассейна. Эта база собирается с помощью Awair HOME-монитора, который регистрирует данные каждые пять минут в течение 76 дней. В базу входят 6 параметров внутренней среды: температура, влажность, уровень углекислого газа, общий объем летучих органических веществ, PM2.5 и PM10. Данные проходят геолокационное размещение, калибровку и стандартные проверки, чтобы обеспечить высокую точность. База данных полностью публична и доступна на ресурсе Figshare.
## Результаты
База данных AQUAIR содержит более 23 000 записей с регулярным временным интервалом. Анализ показал стабильность уровня показателей, за исключением пиков во время кормления, что обеспечивает широкие возможности для моделирования и предсказания. Данные полностью интегрируются в системы машинного обучения, предоставляя возможность разработки моделей для прогнозирования и обнаружения аномалий в условиях рециркуляции воды в рыбных бассейнах.
## Значимость
База данных AQUAIR широко может применяться в области мониторинга и анализа внутренней среды в акклемерационных системах. Она позволяет создавать модели для прогнозирования изменений в условиях воздуха, оптимизации кормления именно во время увеличения загрязнения воздуха. Благодаря открытому доступу, она становится источником для развития новых моделей и инноваций в области интеллектуального управления и прогнозирования внутренней среды в акклемерационных системах.
## Выводы
База данных AQUAIR является ключевым ресурсом для развития интеллектуальных систем мониторинга и управления в рыбном выращивании. Она демонстрирует возможности создания богатых данных и их применения в моделях машинного обучения для прогнозирования и анализа. Будущие исследования будут ориентированы на расширение инструмента
Abstract
Smart aquaculture systems depend on rich environmental data streams to
protect fish welfare, optimize feeding, and reduce energy use. Yet public
datasets that describe the air surrounding indoor tanks remain scarce, limiting
the development of forecasting and anomaly-detection tools that couple
head-space conditions with water-quality dynamics. We therefore introduce
AQUAIR, an open-access public dataset that logs six Indoor Environmental
Quality (IEQ) variables--air temperature, relative humidity, carbon dioxide,
total volatile organic compounds, PM2.5 and PM10--inside a fish aquaculture
facility in Amghass, Azrou, Morocco. A single Awair HOME monitor sampled every
five minutes from 14 October 2024 to 9 January 2025, producing more than 23,000
time-stamped observations that are fully quality-controlled and publicly
archived on Figshare. We describe the sensor placement, ISO-compliant mounting
height, calibration checks against reference instruments, and an open-source
processing pipeline that normalizes timestamps, interpolates short gaps, and
exports analysis-ready tables. Exploratory statistics show stable conditions
(median CO2 = 758 ppm; PM2.5 = 12 micrograms/m3) with pronounced feeding-time
peaks, offering rich structure for short-horizon forecasting, event detection,
and sensor drift studies. AQUAIR thus fills a critical gap in smart aquaculture
informatics and provides a reproducible benchmark for data-centric machine
learning curricula and environmental sensing research focused on head-space
dynamics in recirculating aquaculture systems.