Identifying Group Anchors in Real-World Group Interactions Under Label Scarcity

2509.20762v1 cs.SI, cs.LG 2025-09-27
Авторы:

Fanchen Bu, Geon Lee, Minyoung Choe, Kijung Shin

Резюме на русском

## Контекст Групповые взаимодействия широко распространены в реальном мире и могут принимать различные формы, такие как сотрудничество при написании статей, обмена письмами и участие в онлайн-диалогах. В каждой группе часто есть особенно важное членство, которое образует основу для её существования. Например, это может быть первый или последний автор научной статьи, отправитель электронного письма или вопросительная сторона в онлайн-диалоге. Изучение таких сущностей, называемых "групповыми якорями", может предоставить ценные подсказки для понимания структуры и динамики групповых взаимодействий. Однако существуют проблемы, связанные с недостатком меток и ограниченностью обучающих данных. Это побудило авторов разработать метод, который может работать в таких условиях. ## Метод Метод, предложенный в статье, называется AnchorRadar. Он является полунаблюдательным, то есть основывается на использовании как групп с известными групповыми якорями, так и тех, которые не имеют таких меток. AnchorRadar использует данные из этих групп для выделения общих признаков, которые могут помочь определить групповый якорь. Он основывается на технических решениях, таких как эффективные алгоритмы анализа данных и архитектура, позволяющая быстро и точно определять групповые якоря даже при небольшом количестве меток. ## Результаты В ходе экспериментов, проведенных на 13 реальных наборах данных, AnchorRadar показал свою эффективность в сравнении с другими методами. Его точность в определении групповых якорных субъектов значительно выше, чем у базовых методов, а производительность использования ресурсов (таких как время обучения и количество параметров) значительно лучше. Данные результаты демонстрируют, что AnchorRadar может эффективно работать с ограниченными данными и небольшими обучающими материалами, что делает его применимым в реальных условиях с недостатком меток. ## Значимость AnchorRadar может быть применен в различных сферах, таких как социальные сети, групповые экспертизы, корпоративные коммуникации и другие области, где групповые взаимодействия играют ключевую роль. Его главное преимущество заключается в том, что он может определять групповые якорные элементы даже при недостатке меток, что делает его более универсальным и практичным в реальных задачах. Дальнейшие развитие и применение этого метода могут позволить улучшить понимание групповых структур в различных областях. ## Выводы AnchorRadar доказал свою эффективность в сравнении с другими методами для определения групповых якорных элементов в условиях недостатка меток. Он демонстрирует быст

Abstract

Group interactions occur in various real-world contexts, e.g., co-authorship, email communication, and online Q&A. In each group, there is often a particularly significant member, around whom the group is formed. Examples include the first or last author of a paper, the sender of an email, and the questioner in a Q&A session. In this work, we discuss the existence of such individuals in real-world group interactions. We call such individuals group anchors and study the problem of identifying them. First, we introduce the concept of group anchors and the identification problem. Then, we discuss our observations on group anchors in real-world group interactions. Based on our observations, we develop AnchorRadar, a fast and effective method for group anchor identification under realistic settings with label scarcity, i.e., when only a few groups have known anchors. AnchorRadar is a semi-supervised method using information from groups both with and without known group anchors. Finally, through extensive experiments on thirteen real-world datasets, we demonstrate the empirical superiority of AnchorRadar over various baselines w.r.t. accuracy and efficiency. In most cases, AnchorRadar achieves higher accuracy in group anchor identification than all the baselines, while using 10.2$\times$ less training time than the fastest baseline and 43.6$\times$ fewer learnable parameters than the most lightweight baseline on average.

Ссылки и действия