TRiCo: Triadic Game-Theoretic Co-Training for Robust Semi-Supervised Learning

2509.21526v1 cs.LG, cs.CV 2025-09-30
Авторы:

Hongyang He, Xinyuan Song, Yangfan He, Zeyu Zhang, Yanshu Li, Haochen You, Lifan Sun, Wenqiao Zhang

Резюме на русском

#### Контекст Semi-supervised learning (SSL), широко используемый в машинном обучении, стремится обучать модели с помощью ограниченного набора меток. Однако существующие подходы часто сталкиваются с проблемами, такими как статичность взаимодействия представителей, неустойчивость выбора псевдометок и неэффективное обработка трудных образцов. Эти недостатки приводят к ограниченной гибкости и недостаточной надежности в решении задач. TRiCo (Triadic Game-Theoretic Co-Training) предлагает новый подход, основываясь на играх теории и мета-обучении, чтобы улучшить обработку данных в SSL. #### Метод TRiCo представляет собой трехуровневую архитектуру, включающую два студента-классификатора, мета-обученного теха, а также непараметрический генератор. Основной идеей является формализация SSL в виде трейдической игры, где студенты обучаются на основе замороженных, комплементарных представлений, а теха регулирует выбор псевдометок и баланс потерь с использованием валидационной обратной связи. Для того чтобы обнаруживать слабые места в решении, генератор рассматривает эмбеддинги и имитирует атаки на модель. Этот подход формализуется как игра Stackelberg, где теха выступает в роли лидера, оптимизирующего стратегию, а студенты — в роли последователей, реагирующих на противостояние в условиях адверсарных вмешательств. #### Результаты Эксперименты проводились на таких наборах данных, как CIFAR-10, SVHN, STL-10 и ImageNet. Результаты показали, что TRiCo постоянно достигает лучших результатов в условиях небольших объемов меток. Также было продемонстрировано, что TRiCo не зависит от архитектур, легко адаптируется к различным моделям, в том числе и визуальным бэкбокам, и имеет высокую универсальность. #### Значимость TRiCo может применяться в таких областях, как диагностика и мониторинг, где доступ к меток ограничен, но необходимость в точности высока. Он превосходит существующие подходы, обеспечивая более надежную обработку трудных случаев и меньшую чувствительность к выбору параметров. Благодаря своему адаптивному подходу и поддержке архитектур моделей, TRiCo может стать ключевым инструментом в развитии технологий машинного обучения. #### Выводы TRiCo представляет собой перспективный подход, который избавляет SSL от ограничений статичности и неуверенности в псевдометках, а также эффективно обрабатывает трудные образцы. Дальнейшие исследования будут уделять внимание улучшению непараметрического генератора и расширению применения TRiCo в других областях, таких как дорожный трафик и мониторинг.

Abstract

We introduce TRiCo, a novel triadic game-theoretic co-training framework that rethinks the structure of semi-supervised learning by incorporating a teacher, two students, and an adversarial generator into a unified training paradigm. Unlike existing co-training or teacher-student approaches, TRiCo formulates SSL as a structured interaction among three roles: (i) two student classifiers trained on frozen, complementary representations, (ii) a meta-learned teacher that adaptively regulates pseudo-label selection and loss balancing via validation-based feedback, and (iii) a non-parametric generator that perturbs embeddings to uncover decision boundary weaknesses. Pseudo-labels are selected based on mutual information rather than confidence, providing a more robust measure of epistemic uncertainty. This triadic interaction is formalized as a Stackelberg game, where the teacher leads strategy optimization and students follow under adversarial perturbations. By addressing key limitations in existing SSL frameworks, such as static view interactions, unreliable pseudo-labels, and lack of hard sample modeling, TRiCo provides a principled and generalizable solution. Extensive experiments on CIFAR-10, SVHN, STL-10, and ImageNet demonstrate that TRiCo consistently achieves state-of-the-art performance in low-label regimes, while remaining architecture-agnostic and compatible with frozen vision backbones.

Ссылки и действия