Balancing Accuracy and Novelty with Sub-Item Popularity

2508.05198v1 cs.IR, cs.AI 2025-08-09
Авторы:

Chiara Mallamaci, Aleksandr Vladimirovich Petrov, Alberto Carlo Maria Mancino, Vito Walter Anelli, Tommaso Di Noia, Craig Macdonald

Резюме на русском

## КОНТЕКСТ И ПРОБЛЕМАТИКА Современные системы рекомендаций музыки сталкиваются с фундаментальной дилеммой между точностью предсказаний и способностью предлагать пользователям новый контент. В музыкальной сфере характерной особенностью является повторное прослушивание - пользователи регулярно возвращаются к уже знакомым композициям, что создает сложности для традиционных рекомендательных систем. Это поведение отражает глубоко укоренившиеся музыкальные предпочтения и эмоциональные связи с конкретными треками. Недавние исследования ввели концепцию Персонализированных Оценок Популярности (Personalised Popularity Scores - PPS), которые количественно измеряют индивидуальные предпочтения пользователей на основе исторической частоты прослушиваний. Хотя PPS значительно улучшает релевантность рекомендаций, метод имеет критический недостаток: он склонен усиливать эффект "фильтрационного пузыря", систематически предлагая пользователям только уже знакомый контент. Это ограничивает способность системы представлять новые или неожиданные музыкальные произведения, которые являются ключевыми факторами долгосрочной вовлеченности пользователя и удовлетворенности от сервиса. Проблема усугубляется масштабом современных музыкальных каталогов, содержащих миллионы треков. Традиционные подходы, работающие на уровне отдельных музыкальных композиций, неэффективно используют скрытые структурные паттерны, присутствующие в музыкальных данных. Например, разные треки могут разделять общие музыкальные элементы - мелодические фразы, ритмические паттерны или характеристики тембра - которые остаются невидимыми при анализе на уровне целых композиций. Это приводит к потере потенциально ценной информации о повторяющихся паттернах предпочтений, которые могли бы быть использованы для более тонкой балансировки между точностью и новизной рекомендаций. ## ПРЕДЛОЖЕННЫЙ МЕТОД Авторы предлагают инновационный подход к решению описанной проблемы через переосмысление и адаптацию существующей архитектуры RecJPQ - трансформер-ориентированного фреймворка, первоначально разработанного для улучшения масштабируемости рекомендаций в каталогах с большим количеством элементов через декомпозицию на суб-элементы. Ключевая идея состоит в переносе концепции персонализированной популярности с уровня целых музыкальных композиций на более тонкий уровень суб-идентификаторов (sub-IDs), представляющих латентные структурные компоненты музыкальных треков. Методология строится на гипотезе, что повторяющиеся паттерны предпочтений пользователей проявляются не только на уровне целых композиций, но и на уровне более примитивных музыкальных характеристик, закодированных в суб-эмбеддингах. Это позволяет выявлять скрытые связи между различными треками, которые могут быть неочевидны при традиционном анализе, но разделяют общие музыкальные элементы, вызывающие повторное прослушивание. Техническая реализация включает модификацию механизма внимания в архитектуре RecJPQ для учета суб-ID уровневых персонализированных оценок популярности. Это достигается через внедрение специализированного слоя, который динамически корректирует веса внимания на основе исторических паттернов использования суб-элементов. Такой подход обеспечивает явный контроль баланса между точностью рекомендаций и внедрением персонализированной новизны, позволяя систематически регулировать степень эксплорации нового контента в зависимости от контекста и предпочтений конкретного пользователя. ## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ Экспериментальная валидация проводилась на обширных наборах данных, включающих миллионы взаимодействий пользователей с музыкальным контентом из реальных стриминговых платформ. Исследование использовало стандартные метрики оценки качества рекомендаций, включая Precision@K, Recall@K, NDCG@K для измерения точности, а также специализированные метрики для оценки новизны и серендипитности рекомендаций. Ключевым результатом стало стабильное превосходство предложенного метода sPPS (sub-ID level Personalised Popularity Scores) над традиционным подходом PPS на уровне целых композиций. Конкретно, sPPS продемонстрировал статистически значимое улучшение по метрикам персонализированной нов

Abstract

In the realm of music recommendation, sequential recommenders have shown promise in capturing the dynamic nature of music consumption. A key characteristic of this domain is repetitive listening, where users frequently replay familiar tracks. To capture these repetition patterns, recent research has introduced Personalised Popularity Scores (PPS), which quantify user-specific preferences based on historical frequency. While PPS enhances relevance in recommendation, it often reinforces already-known content, limiting the system's ability to surface novel or serendipitous items - key elements for fostering long-term user engagement and satisfaction. To address this limitation, we build upon RecJPQ, a Transformer-based framework initially developed to improve scalability in large-item catalogues through sub-item decomposition. We repurpose RecJPQ's sub-item architecture to model personalised popularity at a finer granularity. This allows us to capture shared repetition patterns across sub-embeddings - latent structures not accessible through item-level popularity alone. We propose a novel integration of sub-ID-level personalised popularity within the RecJPQ framework, enabling explicit control over the trade-off between accuracy and personalised novelty. Our sub-ID-level PPS method (sPPS) consistently outperforms item-level PPS by achieving significantly higher personalised novelty without compromising recommendation accuracy. Code and experiments are publicly available at https://github.com/sisinflab/Sub-id-Popularity.

Ссылки и действия