Overcoming Over-Fitting in Constraint Acquisition via Query-Driven Interactive Refinement

2509.24489v1 cs.AI, cs.LG, cs.LO, 68T20, 68Q25, I.2.8; F.2.2 2025-10-01
Авторы:

Vasileios Balafas, Dimos Tsouros, Nikolaos Ploskas, Kostas Stergiou

Резюме на русском

## Контекст Процесс моделирования ограничений в конфронтическом программировании часто является значительным бутонном, который автоматизируется в рамках технологии Constraint Acquisition (CA). Однако, методы пассивного CA склонны к переобучению (over-fitting), что приводит к обнаружению спурановых глобальных ограничений при обучении на ограниченных данных. Активные методы, в свою очередь, могут требовать большого количества запросов, что усложняет их применение. Наша работа призвана решить проблему переобучения в CA, объединяя пассивные и активные методы в интерактивную модель, нацеленную на эффективность и точность. ## Метод Мы предлагаем гибридный подход к CA, включающий в себя следующие этапы: 1. **Пассивное обучение**: Используется машинное обучение для генерации начальных кандидатов ограничений. 2. **Интерактивный фаза рефинимента**: Здесь применяются полученные машинными методами приближенные вероятности для определения вероятности переобучения. Эти метрики помогают системе идентифицировать и удалять ложноположительные ограничения. 3. **Механизм исследования подмножеств**: Если кандидат отвергается, система исследует подмножества, находящиеся внутри него, чтобы выделить корректные ограничения. 4. **Активное обучение**: На этом этапе усилия направляются на достижение полноты модели и улучшение ее точности. ## Результаты Мы проверили нашу модель на различных наборах данных, включая задачи с ограниченным объемом примеров. Интерактивная фаза рефинимента позволила значительно сократить количество запросов, необходимых для достижения высокой точности и полноты модели. Эксперименты показали, что наш подход эффективен в борьбе с переобучением и хорошо справляется с ограниченным количеством примеров. ## Значимость Наш подход может быть применен в сферах, где данные ограничены, но требуется надежный и точный анализ ограничений. Одним из преимуществ является уменьшение количества запросов пользователю, что улучшает интерфейс. Будущие исследования будут направлены на улучшение механизма рефинимента и расширение применения гибридной модели к более сложным задачам моделирования ограничений. ## Выводы Мы представили новую гибридную модель CA, которая успешно использует пассивное обучение и интерактивные методы для решения проблемы переобучения. Наши результаты показали, что этот подход эффективен и практичен для задач с ограниченными данными. Мы продолжим исследовать способы улучшения интерактивных механизмов и расширение применения нашего подхода к более сложным задачам.

Abstract

Manual modeling in Constraint Programming is a substantial bottleneck, which Constraint Acquisition (CA) aims to automate. However, passive CA methods are prone to over-fitting, often learning models that include spurious global constraints when trained on limited data, while purely active methods can be query-intensive. We introduce a hybrid CA framework specifically designed to address the challenge of over-fitting in CA. Our approach integrates passive learning for initial candidate generation, a query-driven interactive refinement phase that utilizes probabilistic confidence scores (initialized by machine learning priors) to systematically identify over-fitted constraints, and a specialized subset exploration mechanism to recover valid substructures from rejected candidates. A final active learning phase ensures model completeness. Extensive experiments on diverse benchmarks demonstrate that our interactive refinement phase is crucial for achieving high target model coverage and overall model accuracy from limited examples, doing so with manageable query complexity. This framework represents a substantial advancement towards robust and practical constraint acquisition in data-limited scenarios.

Ссылки и действия