Improved Personalized Headline Generation via Denoising Fake Interests from Implicit Feedback

2508.07178v1 cs.CL, cs.AI 2025-08-13

Авторы:

Kejin Liu, Junhong Lian, Xiang Ao, Ningtao Wang, Xing Fu, Yu Cheng, Weiqiang Wang, Xinyu Liu

Резюме на русском

#### Контекст Подробное описание области исследования, существующих проблем и мотивации ==================================================================== Создание точных персонализированных новостных заголовков является ключевым заданием в сфере рекомендательных систем. Это позволяет улучшить пользовательское вовлечение, увеличить удовлетворение и, в итоге, повысить производительность системы. Основной проблемой в данной области является то, что существующие методы часто не учитывают "шумные" поведенческие данные, которые могут искажать профиль пользователя. Эти "шумные" данные возникают из-за неисключительного интереса пользователя к конкретным новостным материалам, что приводит к неточной характеристике его интересов. Эти ошибки могут привести к генерированию неточных или несоответствующих заголовков, что снижает качество рекомендаций и пользовательский опыт. #### Метод Детальное описание методологии, технических решений и архитектуры ================================================================= Предлагаемый подход, названный **Personalized Headline Generation via Denoising Fake Interests from Implicit Feedback (PHG-DIF)**, включает несколько ключевых шагов. Во-первых, **двойной фильтр** удаляет "шумные" данные из исторических кликов, определяя их по коротким продолжительностям просмотра и аномальным кликам. Во-вторых, **мультиуровневая временная фузирование** позволяет динамически профилировать многомерные интересы пользователя, учитывая их эволюцию во времени. Это позволяет создавать более точные и актуальные новостные заголовки. Фреймворк PHG-DIF также включает в себя архитектуру, основанную на **transformer-based models**, которая обеспечивает эффективное профилирование пользователей и новостных событий. #### Результаты Описание экспериментов, используемых данных и полученных результатов ==================================================================== Чтобы проверить эффективность PHG-DIF, авторы провели эксперименты на новой б BENCHMARK-датесете **DT-PENS**, который содержит данные о кликах 1000 пользователей и почти 10000 аннотированных новостных заголовков. Результаты показали, что PHG-DIF значительно улучшает качество новостных заголовков, повышая как прирост кликов, так и степень точности рекомендаций по сравнению с современными методами. Эти результаты подтверждают, что PHG-DIF способен эффективно удалять "шумные" данные и динамически профилировать интересы пользователей, что приводит к более точным и персонализированным рекомендациям. #### Значимость Области применения, преимущества и потенциальное влияние ======================================================== Предложенный подход может быть применен в различных сферах, включая новостные системы рекомендаций, социальные сети и персонализированные рекламные системы. Он предлагает несколько преимуществ, включая улучшенное качество рекомендаций

Abstract

Accurate personalized headline generation hinges on precisely capturing user interests from historical behaviors. However, existing methods neglect personalized-irrelevant click noise in entire historical clickstreams, which may lead to hallucinated headlines that deviate from genuine user preferences. In this paper, we reveal the detrimental impact of click noise on personalized generation quality through rigorous analysis in both user and news dimensions. Based on these insights, we propose a novel Personalized Headline Generation framework via Denoising Fake Interests from Implicit Feedback (PHG-DIF). PHG-DIF first employs dual-stage filtering to effectively remove clickstream noise, identified by short dwell times and abnormal click bursts, and then leverages multi-level temporal fusion to dynamically model users' evolving and multi-faceted interests for precise profiling. Moreover, we release DT-PENS, a new benchmark dataset comprising the click behavior of 1,000 carefully curated users and nearly 10,000 annotated personalized headlines with historical dwell time annotations. Extensive experiments demonstrate that PHG-DIF substantially mitigates the adverse effects of click noise and significantly improves headline quality, achieving state-of-the-art (SOTA) results on DT-PENS. Our framework implementation and dataset are available at https://github.com/liukejin-up/PHG-DIF.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Improved Personalized Headline Generation via Denoising Fake Interests from Implicit Feedback

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

UW-BioNLP at ChemoTimelines 2025: Thinking, Fine-Tuning, and Dictionary-Enhanced...

AdmTree: Compressing Lengthy Context with Adaptive Semantic Trees

SignRoundV2: Closing the Performance Gap in Extremely Low-Bit Post-Training Quan...

Mitigating Catastrophic Forgetting in Target Language Adaptation of LLMs via Sou...

SEAL: Self-Evolving Agentic Learning for Conversational Question Answering over ...

Навигация