TRiCo: Triadic Game-Theoretic Co-Training for Robust Semi-Supervised Learning
2509.21526v1
cs.LG, cs.CV
2025-09-30
Авторы:
Hongyang He, Xinyuan Song, Yangfan He, Zeyu Zhang, Yanshu Li, Haochen You, Lifan Sun, Wenqiao Zhang
Резюме на русском
#### Контекст
Semi-supervised learning (SSL), широко используемый в машинном обучении, стремится обучать модели с помощью ограниченного набора меток. Однако существующие подходы часто сталкиваются с проблемами, такими как статичность взаимодействия представителей, неустойчивость выбора псевдометок и неэффективное обработка трудных образцов. Эти недостатки приводят к ограниченной гибкости и недостаточной надежности в решении задач. TRiCo (Triadic Game-Theoretic Co-Training) предлагает новый подход, основываясь на играх теории и мета-обучении, чтобы улучшить обработку данных в SSL.
#### Метод
TRiCo представляет собой трехуровневую архитектуру, включающую два студента-классификатора, мета-обученного теха, а также непараметрический генератор. Основной идеей является формализация SSL в виде трейдической игры, где студенты обучаются на основе замороженных, комплементарных представлений, а теха регулирует выбор псевдометок и баланс потерь с использованием валидационной обратной связи. Для того чтобы обнаруживать слабые места в решении, генератор рассматривает эмбеддинги и имитирует атаки на модель. Этот подход формализуется как игра Stackelberg, где теха выступает в роли лидера, оптимизирующего стратегию, а студенты — в роли последователей, реагирующих на противостояние в условиях адверсарных вмешательств.
#### Результаты
Эксперименты проводились на таких наборах данных, как CIFAR-10, SVHN, STL-10 и ImageNet. Результаты показали, что TRiCo постоянно достигает лучших результатов в условиях небольших объемов меток. Также было продемонстрировано, что TRiCo не зависит от архитектур, легко адаптируется к различным моделям, в том числе и визуальным бэкбокам, и имеет высокую универсальность.
#### Значимость
TRiCo может применяться в таких областях, как диагностика и мониторинг, где доступ к меток ограничен, но необходимость в точности высока. Он превосходит существующие подходы, обеспечивая более надежную обработку трудных случаев и меньшую чувствительность к выбору параметров. Благодаря своему адаптивному подходу и поддержке архитектур моделей, TRiCo может стать ключевым инструментом в развитии технологий машинного обучения.
#### Выводы
TRiCo представляет собой перспективный подход, который избавляет SSL от ограничений статичности и неуверенности в псевдометках, а также эффективно обрабатывает трудные образцы. Дальнейшие исследования будут уделять внимание улучшению непараметрического генератора и расширению применения TRiCo в других областях, таких как дорожный трафик и мониторинг.
Abstract
We introduce TRiCo, a novel triadic game-theoretic co-training framework that
rethinks the structure of semi-supervised learning by incorporating a teacher,
two students, and an adversarial generator into a unified training paradigm.
Unlike existing co-training or teacher-student approaches, TRiCo formulates SSL
as a structured interaction among three roles: (i) two student classifiers
trained on frozen, complementary representations, (ii) a meta-learned teacher
that adaptively regulates pseudo-label selection and loss balancing via
validation-based feedback, and (iii) a non-parametric generator that perturbs
embeddings to uncover decision boundary weaknesses. Pseudo-labels are selected
based on mutual information rather than confidence, providing a more robust
measure of epistemic uncertainty. This triadic interaction is formalized as a
Stackelberg game, where the teacher leads strategy optimization and students
follow under adversarial perturbations. By addressing key limitations in
existing SSL frameworks, such as static view interactions, unreliable
pseudo-labels, and lack of hard sample modeling, TRiCo provides a principled
and generalizable solution. Extensive experiments on CIFAR-10, SVHN, STL-10,
and ImageNet demonstrate that TRiCo consistently achieves state-of-the-art
performance in low-label regimes, while remaining architecture-agnostic and
compatible with frozen vision backbones.
Ссылки и действия
Дополнительные ресурсы: