Looking into the Unknown: Exploring Action Discovery for Segmentation of Known and Unknown Actions
2508.05529v1
cs.CV
2025-08-09
Авторы:
Federico Spurio, Emad Bahrami, Olga Zatsarynna, Yazan Abu Farha, Gianpiero Francesca, Juergen Gall
Резюме на русском
**Резюме**
В статье представлена новая постановка задачи в рамках темпоральной разметки действий (Temporal Action Segmentation), названная Action Discovery. Эта постановка решает проблему неоднозначности и неполноты аннотаций в задачах сегментации действий, когда только часть действий в тренировочном наборе помечена, а остальные остаются неизвестными и непомеченными. Такая ситуация часто встречается в области нейронаук, где естественно установленные поведения (например, ходьба, есть) соседствуют с неочевидными и редкими действиями, которые обычно не помечаются. Также данная постановка актуальна для приложений с частично заполненными данными из-за неясных или отсутствующих меток.
Авторы предлагают двухэтапный подход для решения этой задачи. В первом этапе используется модуль Granularity-Guided Segmentation (GGSM) для определения границ и гранулярности сегментов для как известных, так и неизвестных действий. Во втором этапе используется Unknown Action Segment Assignment (UASA) для ассоциации неизвестных действий с семантически значимыми классами, определяемыми с помощью ембеддингов. Эксперименты на трех сложных наборах данных (Breakfast, 50Salads и Desktop Assembly) показали, что предложенный подход выдает значительные улучшения по сравнению с другими методами. Эта работа открывает путь к эффективному обнаружению действий в сложных и неполностью аннотированных наборах данных.
Abstract
We introduce Action Discovery, a novel setup within Temporal Action
Segmentation that addresses the challenge of defining and annotating ambiguous
actions and incomplete annotations in partially labeled datasets. In this
setup, only a subset of actions - referred to as known actions - is annotated
in the training data, while other unknown actions remain unlabeled. This
scenario is particularly relevant in domains like neuroscience, where
well-defined behaviors (e.g., walking, eating) coexist with subtle or
infrequent actions that are often overlooked, as well as in applications where
datasets are inherently partially annotated due to ambiguous or missing labels.
To address this problem, we propose a two-step approach that leverages the
known annotations to guide both the temporal and semantic granularity of
unknown action segments. First, we introduce the Granularity-Guided
Segmentation Module (GGSM), which identifies temporal intervals for both known
and unknown actions by mimicking the granularity of annotated actions. Second,
we propose the Unknown Action Segment Assignment (UASA), which identifies
semantically meaningful classes within the unknown actions, based on learned
embedding similarities. We systematically explore the proposed setting of
Action Discovery on three challenging datasets - Breakfast, 50Salads, and
Desktop Assembly - demonstrating that our method considerably improves upon
existing baselines.
Ссылки и действия
Дополнительные ресурсы: