A Defect Classification Framework for AI-Based Software Systems (AI-ODC)
2508.17900v1
cs.SE, cs.AI
2025-08-27
Авторы:
Mohammed O. Alannsary
Резюме на русском
## Контекст
Современные технологии искусственного интеллекта (ИИ) применяются во многих областях, от повседневных задач, таких как ответы на электронные письма и планирование, до промышленности и автоматизации производственных процессов. Однако использование ИИ связано с риском возникновения ошибок и дефектов в программном обеспечении, что может привести к серьезным последствиям. Дефектный анализ является ключевым элементом обеспечения качества программного обеспечения, но существующие модели дефектного анализа не учитывают уникальные характеристики AI-систем. Это приводит к ограниченной эффективности дефектного анализа в AI-системах. Целью данного исследования является разработка фреймворка для дефектного анализа AI-систем, который учитывает их особенности.
## Метод
Фреймворк AI-ODC основывается на парадигме Orthogonal Defect Classification (ODC), но адаптирован для AI-систем. Он включает новые классификационные размерности: "Data", "Learning" и "Thinking", которые отражают особенности ИИ. Для каждой размерности были введены дополнительные атрибуты и уровни серьезности. Также были пересмотрены "impact areas", заменены на понятия, характерные для AI-систем. Фреймворк был реализован и проверен на открытом датасете с дефектами в машинном обучении. Эксперименты включали один- и двухмерные анализы результатов.
## Результаты
Исследование показало, что большая часть дефектов возникает во время "Learning" фазы и часто имеют высокий уровень серьезности. Дефекты во время "Thinking" фазы, хотя и менее часты, имеют большое влияние на надежность и точность. Эти результаты помогают выявить самые рискованные категории дефектов и ориентировать качественные меры на их устранение.
## Значимость
Фреймворк AI-ODC может быть использован в различных областях, где применяются AI-системы, включая промышленность, здравоохранение и финансы. Он обеспечивает более точный дефектный анализ, учитывая уникальные черты AI-систем. Использование этого фреймворка может снизить риск ошибок, увеличить надежность и улучшить качество AI-систем, что вносит полезный вклад в развитие ИИ.
## Выводы
AI-ODC доказал свою эффективность в классификации дефектов AI-систем, учитывая их особенности. Будущие исследования будут сфокусированы на расширении фреймворка для других типов AI-систем и интеграции с методами управления качеством программного обеспечения.
Abstract
Artificial Intelligence has gained a lot of attention recently, it has been
utilized in several fields ranging from daily life activities, such as
responding to emails and scheduling appointments, to manufacturing and
automating work activities. Artificial Intelligence systems are mainly
implemented as software solutions, and it is essential to discover and remove
software defects to assure its quality using defect analysis which is one of
the major activities that contribute to software quality. Despite the
proliferation of AI-based systems, current defect analysis models fail to
capture their unique attributes. This paper proposes a framework inspired by
the Orthogonal Defect Classification (ODC) paradigm and enables defect analysis
of Artificial Intelligence systems while recognizing its special attributes and
characteristics. This study demonstrated the feasibility of modifying ODC for
AI systems to classify its defects. The ODC was adjusted to accommodate the
Data, Learning, and Thinking aspects of AI systems which are newly introduced
classification dimensions. This adjustment involved the introduction of an
additional attribute to the ODC attributes, the incorporation of a new severity
level, and the substitution of impact areas with characteristics pertinent to
AI systems. The framework was showcased by applying it to a publicly available
Machine Learning bug dataset, with results analyzed through one-way and two-way
analysis. The case study indicated that defects occurring during the Learning
phase were the most prevalent and were significantly linked to high-severity
classifications. In contrast, defects identified in the Thinking phase had a
disproportionate effect on trustworthiness and accuracy. These findings
illustrate AIODC's capability to identify high-risk defect categories and
inform focused quality assurance measures.
Ссылки и действия
Дополнительные ресурсы: