Overcoming Over-Fitting in Constraint Acquisition via Query-Driven Interactive Refinement
2509.24489v1
cs.AI, cs.LG, cs.LO, 68T20, 68Q25, I.2.8; F.2.2
2025-10-01
Авторы:
Vasileios Balafas, Dimos Tsouros, Nikolaos Ploskas, Kostas Stergiou
Резюме на русском
## Контекст
Процесс моделирования ограничений в конфронтическом программировании часто является значительным бутонном, который автоматизируется в рамках технологии Constraint Acquisition (CA). Однако, методы пассивного CA склонны к переобучению (over-fitting), что приводит к обнаружению спурановых глобальных ограничений при обучении на ограниченных данных. Активные методы, в свою очередь, могут требовать большого количества запросов, что усложняет их применение. Наша работа призвана решить проблему переобучения в CA, объединяя пассивные и активные методы в интерактивную модель, нацеленную на эффективность и точность.
## Метод
Мы предлагаем гибридный подход к CA, включающий в себя следующие этапы:
1. **Пассивное обучение**: Используется машинное обучение для генерации начальных кандидатов ограничений.
2. **Интерактивный фаза рефинимента**: Здесь применяются полученные машинными методами приближенные вероятности для определения вероятности переобучения. Эти метрики помогают системе идентифицировать и удалять ложноположительные ограничения.
3. **Механизм исследования подмножеств**: Если кандидат отвергается, система исследует подмножества, находящиеся внутри него, чтобы выделить корректные ограничения.
4. **Активное обучение**: На этом этапе усилия направляются на достижение полноты модели и улучшение ее точности.
## Результаты
Мы проверили нашу модель на различных наборах данных, включая задачи с ограниченным объемом примеров. Интерактивная фаза рефинимента позволила значительно сократить количество запросов, необходимых для достижения высокой точности и полноты модели. Эксперименты показали, что наш подход эффективен в борьбе с переобучением и хорошо справляется с ограниченным количеством примеров.
## Значимость
Наш подход может быть применен в сферах, где данные ограничены, но требуется надежный и точный анализ ограничений. Одним из преимуществ является уменьшение количества запросов пользователю, что улучшает интерфейс. Будущие исследования будут направлены на улучшение механизма рефинимента и расширение применения гибридной модели к более сложным задачам моделирования ограничений.
## Выводы
Мы представили новую гибридную модель CA, которая успешно использует пассивное обучение и интерактивные методы для решения проблемы переобучения. Наши результаты показали, что этот подход эффективен и практичен для задач с ограниченными данными. Мы продолжим исследовать способы улучшения интерактивных механизмов и расширение применения нашего подхода к более сложным задачам.
Abstract
Manual modeling in Constraint Programming is a substantial bottleneck, which
Constraint Acquisition (CA) aims to automate. However, passive CA methods are
prone to over-fitting, often learning models that include spurious global
constraints when trained on limited data, while purely active methods can be
query-intensive. We introduce a hybrid CA framework specifically designed to
address the challenge of over-fitting in CA. Our approach integrates passive
learning for initial candidate generation, a query-driven interactive
refinement phase that utilizes probabilistic confidence scores (initialized by
machine learning priors) to systematically identify over-fitted constraints,
and a specialized subset exploration mechanism to recover valid substructures
from rejected candidates. A final active learning phase ensures model
completeness. Extensive experiments on diverse benchmarks demonstrate that our
interactive refinement phase is crucial for achieving high target model
coverage and overall model accuracy from limited examples, doing so with
manageable query complexity. This framework represents a substantial
advancement towards robust and practical constraint acquisition in data-limited
scenarios.