Looking into the Unknown: Exploring Action Discovery for Segmentation of Known and Unknown Actions

2508.05529v1 cs.CV 2025-08-09
Авторы:

Federico Spurio, Emad Bahrami, Olga Zatsarynna, Yazan Abu Farha, Gianpiero Francesca, Juergen Gall

Резюме на русском

**Резюме** В статье представлена новая постановка задачи в рамках темпоральной разметки действий (Temporal Action Segmentation), названная Action Discovery. Эта постановка решает проблему неоднозначности и неполноты аннотаций в задачах сегментации действий, когда только часть действий в тренировочном наборе помечена, а остальные остаются неизвестными и непомеченными. Такая ситуация часто встречается в области нейронаук, где естественно установленные поведения (например, ходьба, есть) соседствуют с неочевидными и редкими действиями, которые обычно не помечаются. Также данная постановка актуальна для приложений с частично заполненными данными из-за неясных или отсутствующих меток. Авторы предлагают двухэтапный подход для решения этой задачи. В первом этапе используется модуль Granularity-Guided Segmentation (GGSM) для определения границ и гранулярности сегментов для как известных, так и неизвестных действий. Во втором этапе используется Unknown Action Segment Assignment (UASA) для ассоциации неизвестных действий с семантически значимыми классами, определяемыми с помощью ембеддингов. Эксперименты на трех сложных наборах данных (Breakfast, 50Salads и Desktop Assembly) показали, что предложенный подход выдает значительные улучшения по сравнению с другими методами. Эта работа открывает путь к эффективному обнаружению действий в сложных и неполностью аннотированных наборах данных.

Abstract

We introduce Action Discovery, a novel setup within Temporal Action Segmentation that addresses the challenge of defining and annotating ambiguous actions and incomplete annotations in partially labeled datasets. In this setup, only a subset of actions - referred to as known actions - is annotated in the training data, while other unknown actions remain unlabeled. This scenario is particularly relevant in domains like neuroscience, where well-defined behaviors (e.g., walking, eating) coexist with subtle or infrequent actions that are often overlooked, as well as in applications where datasets are inherently partially annotated due to ambiguous or missing labels. To address this problem, we propose a two-step approach that leverages the known annotations to guide both the temporal and semantic granularity of unknown action segments. First, we introduce the Granularity-Guided Segmentation Module (GGSM), which identifies temporal intervals for both known and unknown actions by mimicking the granularity of annotated actions. Second, we propose the Unknown Action Segment Assignment (UASA), which identifies semantically meaningful classes within the unknown actions, based on learned embedding similarities. We systematically explore the proposed setting of Action Discovery on three challenging datasets - Breakfast, 50Salads, and Desktop Assembly - demonstrating that our method considerably improves upon existing baselines.

Ссылки и действия