📚 Саммари научных статей из arXiv

Найдено 211 результатов по запросу 'cs.IR, cs.AI' Сбросить поиск

📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня

📄 Enhancing Serendipity Recommendation System by Constructing Dynamic User Knowledge Graphs with Large Language Models

2025-08-09

Авторы:

Qian Yong, Yanhui Li, Jialiang Shi, Yaguang Dou, Tian Qi

## КОНТЕКСТ И ПРОБЛЕМАТИКА Рекомендательные системы (RS) играют ключевую роль в формировании пользовательского опыта в современных индустриальных приложениях. Однако существующие системы часто сталкиваются с проблемами, такими как фильтр пузырьков, когда пользователи получают однородный контент, что ведет к снижению удовлетворенности и разнообразия рекомендованных материалов. Основная причина этих проблем заключается в цикле обратной связи, который поощряет рекомендации похожего контента на основе прошлых действий пользователя, что может приводить к узкому восприятию интересов пользователей. В последнее время, большие языковые модели (LLMs) привлекли значительное внимание в области рекомендательных систем, благодаря их высокому уровню общей знанию и способности к продвинутому резонированию. Однако, несмотря на их потенциал, внедрение LLMs в RS сталкивается с некоторыми трудностями. Одной из основных проблем является сохранение логичности резонирования, полезность результатов, а также удовлетворение требований задержки (латентности), что необходимо для работы рекомендательных систем в реальном времени. Требуется решение, способное обеспечить качество рекомендаций, сохранив при этом эффективность в работе. ## ПРЕДЛОЖЕННЫЙ МЕТОД Для решения вышеупомянутых проблем, авторы предлагают новый метод, основанный на динамическом построении пользовательских знаний с помощью LLMs. Метод включает в себя двухэтапную рамку (two-stage framework): 1. **Двух-хоп резонирование (Two-hop reasoning)**: Этот этап использует статические профили пользователей и их исторические данные о поведении для динамического построения пользовательских графов знаний. Двух-хоп резонирование проводится на этих графах, что позволяет улучшить качество и точность результатов резонирования. Это помогает выявить потенциальные интересы пользователей, которые могут быть неочевидными на основе прошлых действий. 2. **Близковременная адаптация (Near-line adaptation)**: Для внедрения этого подхода в индустриальные рекомендательные системы, авторы предлагают эффективный метод развертывания. Он включает в себя модель поиска u2i (user-to-item), которая также имеет возможности i2i (item-to-item) поиска. Эта модель позволяет получать релевантные результаты, которые соответствуют новым интересам пользователя, при этом сохраняя высокую конверсию традиционных моделей u2i. ## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ Для оценки эффективности предложенного метода, авторы проводили онлайн-эксперименты на базе приложения Dewu, которое обслуживает десятки миллионов пользователей. Результаты экспериментов показали значительное улучшение показателей: - **Увеличение новизны рекомендаций**: Экспозиция нового контента (exposure novelty rate) выросла на 4.62%, а новизна кликов (click novelty rate) на 4.85%. - **Улучшение пользовательского опыта**: Среднее время просмотра (average view duration) увеличилось на 0.15%, а уникальный показатель кликов (unique visitor click-through rate) — на 0.07%. - **Повышение взаимодействия пользователей**: Уникальный показатель взаимодействия (unique visitor interaction penetration) вырос на 0.30%. ## ПРАКТИЧЕСКАЯ ЗНАЧИМОСТЬ Предложенный метод обеспечивает значительное улучшение качества рекомендаций, способствуя более разнообразному и новому контенту, который может привести к более высокой удовлетворенности пользователей. Он также позволяет эффективно внедрять LLMs в рекомендательные системы, сохраняя при этом требования к производительности и латентности, что делает его применимым в индустриальных условиях. ## ВЫВОДЫ И ПЕРСПЕКТИВЫ Предложенный метод является важной шагом в улучшении рекомендательных систем, особенно в контексте борьбы с фильтром пузырьков и повышении пользовательского опыта. Будущие исследования могут фокусироваться на дальнейшем улучшении эффективности LLMs в реальных условиях, а также на расширении методологии для других доменов применения рекомендательных систем.

Annotation:

The feedback loop in industrial recommendation systems reinforces homogeneous content, creates filter bubble effects, and diminishes user satisfaction. Recently, large language models(LLMs) have demonstrated potential in serendipity recommendation, thanks to their extensive world knowledge and superior reasoning capabilities. However, these models still face challenges in ensuring the rationality of the reasoning process, the usefulness of the reasoning results, and meeting the latency requireme...

ID: 2508.04032v1 cs.IR, cs.AI

arXiv PDF

📄 Comparative Analysis of Novel NIRMAL Optimizer Against Adam and SGD with Momentum

2025-08-09

Авторы:

Nirmal Gaud, Surej Mouli, Preeti Katiyar, Vaduguru Venkata Ramya

Данная статья предлагает NIRMAL (Novel Integrated Robust Multi-Adaptation Learning) — новую методику оптимизации, которая объединяет стратегии градиентного спуска, момента, стохастической погрешности, адаптивных обучений и нелинейных преобразований. Разработанный подход был протестирован на бенчмарковых датасетах MNIST, FashionMNIST, CIFAR-10 и CIFAR-100 с использованием пользовательской архитектуры CNN. Результаты показали, что NIRMAL демонстрирует высокую эффективность, особенно на сложных датасетах, таких как CIFAR-100, где достиг тестовой точности 45,32% и F1-score 0,4328. Это приемлемо превышает результаты Adam (41,79% точность, 0,3964 F1-score) и примерно соответствует SGD с моментом (46,97% точность, 0,4531 F1-score). Также NIRMAL проявил сильные тренды устойчивости при обучении и хорошую общей способность. Эти результаты подтверждают значительную потенциальную эффективность NIRMAL для решения задач в области глубокого обучения.

Annotation:

This study proposes NIRMAL (Novel Integrated Robust Multi-Adaptation Learning), a novel optimization algorithm that combines multiple strategies inspired by the movements of the chess piece. These strategies include gradient descent, momentum, stochastic perturbations, adaptive learning rates, and non-linear transformations. We carefully evaluated NIRMAL against two widely used and successful optimizers, Adam and SGD with Momentum, on four benchmark image classification datasets: MNIST, FashionM...

ID: 2508.04293v1 cs.IR, cs.AI

arXiv PDF

📄 Align-for-Fusion: Harmonizing Triple Preferences via Dual-oriented Diffusion for Cross-domain Sequential Recommendation

2025-08-09

Авторы:

Yongfu Zha, Xinxin Dong, Haokai Ma, Yonghui Yang, Xiaodong Wang

## КОНТЕКСТ И ПРОБЛЕМАТИКА Персонализированная секвенциальная рекомендация является ключевым направлением при построении систем рекомендаций, целью которых является предсказание подходящих предметов для пользователей на основе их поведенческих последовательностей. Однако, существующие методы сталкиваются с проблемами, такими как разреженность данных и смещение интересов пользователей. Чтобы уменьшить эти недостатки, многие подходы используют вспомогательные данные из других доменов через переходы между доменами. В настоящее время, существующие методы кросс-доменной секвенциальной рекомендации (Cross-Domain Sequential Recommendation, CDSR) часто следуют парадигме "align-then-fusion" (выравнивание, затем слияние). Этот подход включает выравнивание представлений из разных доменов на уровне представлений, а затем механическое объединение их для формирования рекомендаций. Однако, такой подход игнорирует тонкую интеграцию доменно-специфических предпочтений, что может привести к недостаточной связности между доменами и неэффективному использованию вспомогательных данных. Недавние достижения в области диффузионных моделей (Diffusion Models, DMs) для выравнивания распределений показали возможность улучшения стабильности и точности моделей. Однако, в существующих рекомендательных системах, основанных на диффузионных моделях, существует проблема нестабильности, вызванная шумом, внедряемым в процессе диффузии. Это может привести к неточному моделированию предпочтений пользователей. Таким образом, необходимо разработать более эффективный метод для выравнивания и слияния предпочтений из разных доменов, который учитывает тонкие особенности каждого домена и уменьшает влияние шума. ## ПРЕДЛОЖЕННЫЙ МЕТОД В данной работе предлагается новый фреймворк для CDSR, называемый **HorizonRec**, который использует диффузионные модели для выравнивания и слияния предпочтений из трех доменов. Основной идеей является "align-for-fusion" (выравнивание для слияния), которая направлена на тонкую гармонизацию предпочтений пользователей из разных доменов. Для решения проблемы нестабильности, связанной с шумом в диффузионных моделях, авторы предлагают использовать стратегию **mixed-conditioned distribution retrieval** (смешанное извлечение условных распределений). Эта стратегия использует распределения, полученные из поведенческой логики пользователей, как семантические мосты между доменами. Это позволяет создать более согласованную модель предпочтений в многодоменном контексте. Кроме того, предлагается **dual-oriented preference diffusion method** (двунаправленный метод диффузии предпочтений), который позволяет подавлять шум и подчеркивать предпочтения, относящиеся к целевому домену, в процессе слияния представлений пользователей. Этот метод помогает усилить важность целевых интересов и снизить нежелательное влияние несвязанных или неточных данных. ## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ Для оценки эффективности предложенного метода проведены эксперименты на четырех наборах данных CDSR, полученных с двух разных платформ. Эти наборы данных представляют собой реальные поведенческие последовательности пользователей, позволяющие провести комплексный анализ работы HorizonRec. Результаты экспериментов показывают, что HorizonRec значительно превосходит существующие методы CDSR в трех ключевых аспектах: 1. **Точность рекомендаций**: Модель достигает высокого уровня точности предсказания пользовательских предпочтений, особенно при работе с тремя доменами. 2. **Робастность**: Метод показывает стабильное поведение даже при наличии шума и неполных данных, что является важной характеристикой для реального применения. 3. **Сходимость доменно-специфических предпочтений**: Благодаря использованию стратегии mixed-conditioned distribution retrieval и двунаправленного метода диффузии, модель эффективно гармонизирует предпочтения из разных доменов, сохраняя их тонкую специфику. ## ПРАКТИЧЕСКАЯ ЗНАЧИМОСТЬ Предложенный метод HorizonRec имеет широкое применение в области персонализированных рекомендаций, особенно в ситуациях, когда необходимо использовать данные из нескольких доменов для улучшения качества рекомендаций. Он может быть использован в различных приложениях, таких как: - **E-commerce**: Улучшение рекомендаций товаров для пользователей на основе их поведения в различных категориях. - **Онлайн-медиа**: Личностное предлагаемое контента (например, видео, музыки) на основе поведения пользователей в разных сферах. - **Туризм и гостиничный бизнес**: Рекомендации мест посещения или услуг на основе предпочтений пользователей в разных сферах (например, культура, развлечения, питание). Преимуществом данного метода является его способность обрабатывать несколько доменов одновременно, сохраняя тонкую специфику каждого домена, что делает его применимым в различных контекстах рекомендаций. ## ВЫВОДЫ И ПЕРСПЕКТИВЫ В работе представлен фреймворк HorizonRec, который решает проблему неэффективного выравнивания и слияния предпочтений в кросс-доменной секвенциальной рекомендации. Используя диффузионные модели и стратегию mixed-conditioned distribution retrieval, HorizonRec достигает высокой точности и робастности в моделировании предпочтений пользователей в многодоменном контексте. Будущие исследования могут быть направлены на дальнейшее улучшение стабильности диффузионных моделей и расширение метода на более широкий класс задач, включая мультимодальные рекомендации и кросс-доменные задачи вне рекомендательных систем. Также, можно исследовать влияние различных типов шума на процесс диффузии и разработать более эффективные стратегии для уменьшения влияния шума на качество рекомендаций.

Annotation:

Personalized sequential recommendation aims to predict appropriate items for users based on their behavioral sequences. To alleviate data sparsity and interest drift issues, conventional approaches typically incorporate auxiliary behaviors from other domains via cross-domain transition. However, existing cross-domain sequential recommendation (CDSR) methods often follow an align-then-fusion paradigm that performs representation-level alignment across multiple domains and combines them mechanical...

ID: 2508.05074v1 cs.IR, cs.AI

arXiv PDF

📄 Tool Graph Retriever: Exploring Dependency Graph-based Tool Retrieval for Large Language Models

2025-08-09

Авторы:

Linfeng Gao, Yaoxiang Wang, Minlong Peng, Jialong Tang, Yuzhe Shang, Mingming Sun, Jinsong Su

## КОНТЕКСТ И ПРОБЛЕМАТИКА Современное развитие ИИ-агентов привело к экспоненциальному росту количества доступных инструментов, которыми эти агенты могут пользоваться для решения сложных задач. От калькуляторов и поисковых систем до специализированных API и баз данных — арсенал инструментов становится все более разнообразным и мощным. Однако это богатство возможностей порождает критическую проблему: контекстные ограничения больших языковых моделей не позволяют эффективно обрабатывать все доступные инструменты одновременно. Традиционные методы встраивания информации об инструментах напрямую в контекст модели становятся непрактичными при наличии тысяч или десятков тысяч доступных опций. Существующие подходы к решению этой проблемы в основном опираются на семантическое сходство между описаниями инструментов и пользовательскими запросами. Эти методы рассматривают каждый инструмент как независимую единицу, игнорируя фундаментальную особенность реальных сценариев использования: инструменты редко используются изолированно. Большинство сложных задач требуют цепочки взаимосвязанных инструментов, где выход одного служит входом для другого. Например, для анализа финансовых данных может потребоваться сначала извлечь данные из базы, затем очистить их с помощью специализированного инструмента, после чего применить алгоритм анализа. Пропуск любого из этих зависимых инструментов приведет к невозможности выполнения задачи. Эта проблема особенно актуальна в контексте развития агентных систем, где эффективность работы напрямую зависит от способности быстро и точно идентифицировать не только первично релевантные инструменты, но и все необходимые зависимости между нами. Текущие методы, фокусирующиеся исключительно на семантическом соответствии, упускают эти критические зависимости, что приводит к снижению общей эффективности системы и увеличению количества неудачных попыток выполнения задач. ## ПРЕДЛОЖЕННЫЙ МЕТОД Авторы статьи предлагают инновационный подход Tool Graph Retriever (TGR), который революционизирует процесс поиска инструментов за счет учета их зависимостей. Методология TGR строится на трех ключевых компонентах: создании специализированного датасета, построении графа зависимостей инструментов и применении графовых нейронных сетей для обогащения представлений. Первым этапом разработки стало создание масштабного датасета TDI300K, содержащего 300 тысяч примеров для обучения дискриминатора, способного выявлять зависимости между инструментами. Этот датасет был собран через систематический анализ реальных сценариев использования инструментов в различных доменах, включая анализ данных, веб-разработку, математические вычисления и обработку естественного языка. Каждая запись в датасете содержит пару инструментов и метку, указывающую на наличие или отсутствие зависимости между ними. На втором этапе все кандидатские инструменты представляются в виде ориентированного графа зависимостей, где вершины соответствуют инструментам, а ребра - направленным зависимостям. Этот граф строится динамически для каждого запроса на основе предварительно обученного дискриминатора. Архитектура графа позволяет моделировать сложные отношения, включая множественные входы и выходы, циклические зависимости и иерархические структуры. Ключевым техническим решением является применение графовой свертки (graph convolution) для интеграции информации о зависимостях в векторные представления инструментов. Многослойная графовая нейронная сеть последовательно агрегирует информацию от соседних узлов, позволяя каждому инструменту "узнать" о своих зависимостях и зависимых от него инструментах. Этот процесс обогащает исходные семантические представления контекстом их использования и роли в экосистеме инструментов. Для онлайн-ретривала используется двухэтапная система: сначала при помощи обогащенных представлений выбирается кандидатская группа инструментов, затем применяется ранжирование с учетом как релевантности запросу, так и полноты покрытия зависимостей. Это обеспечивает баланс между точностью и полнотой результатов поиска. ## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ Экспериментальная оценка TGR проводилась на трех стандарт

Annotation:

With the remarkable advancement of AI agents, the number of their equipped tools is increasing rapidly. However, integrating all tool information into the limited model context becomes impractical, highlighting the need for efficient tool retrieval methods. In this regard, dominant methods primarily rely on semantic similarities between tool descriptions and user queries to retrieve relevant tools. However, they often consider each tool independently, overlooking dependencies between tools, whic...

ID: 2508.05152v1 cs.IR, cs.AI

arXiv PDF

📄 Balancing Accuracy and Novelty with Sub-Item Popularity

2025-08-09

Авторы:

Chiara Mallamaci, Aleksandr Vladimirovich Petrov, Alberto Carlo Maria Mancino, Vito Walter Anelli, Tommaso Di Noia, Craig Macdonald

## КОНТЕКСТ И ПРОБЛЕМАТИКА Современные системы рекомендаций музыки сталкиваются с фундаментальной дилеммой между точностью предсказаний и способностью предлагать пользователям новый контент. В музыкальной сфере характерной особенностью является повторное прослушивание - пользователи регулярно возвращаются к уже знакомым композициям, что создает сложности для традиционных рекомендательных систем. Это поведение отражает глубоко укоренившиеся музыкальные предпочтения и эмоциональные связи с конкретными треками. Недавние исследования ввели концепцию Персонализированных Оценок Популярности (Personalised Popularity Scores - PPS), которые количественно измеряют индивидуальные предпочтения пользователей на основе исторической частоты прослушиваний. Хотя PPS значительно улучшает релевантность рекомендаций, метод имеет критический недостаток: он склонен усиливать эффект "фильтрационного пузыря", систематически предлагая пользователям только уже знакомый контент. Это ограничивает способность системы представлять новые или неожиданные музыкальные произведения, которые являются ключевыми факторами долгосрочной вовлеченности пользователя и удовлетворенности от сервиса. Проблема усугубляется масштабом современных музыкальных каталогов, содержащих миллионы треков. Традиционные подходы, работающие на уровне отдельных музыкальных композиций, неэффективно используют скрытые структурные паттерны, присутствующие в музыкальных данных. Например, разные треки могут разделять общие музыкальные элементы - мелодические фразы, ритмические паттерны или характеристики тембра - которые остаются невидимыми при анализе на уровне целых композиций. Это приводит к потере потенциально ценной информации о повторяющихся паттернах предпочтений, которые могли бы быть использованы для более тонкой балансировки между точностью и новизной рекомендаций. ## ПРЕДЛОЖЕННЫЙ МЕТОД Авторы предлагают инновационный подход к решению описанной проблемы через переосмысление и адаптацию существующей архитектуры RecJPQ - трансформер-ориентированного фреймворка, первоначально разработанного для улучшения масштабируемости рекомендаций в каталогах с большим количеством элементов через декомпозицию на суб-элементы. Ключевая идея состоит в переносе концепции персонализированной популярности с уровня целых музыкальных композиций на более тонкий уровень суб-идентификаторов (sub-IDs), представляющих латентные структурные компоненты музыкальных треков. Методология строится на гипотезе, что повторяющиеся паттерны предпочтений пользователей проявляются не только на уровне целых композиций, но и на уровне более примитивных музыкальных характеристик, закодированных в суб-эмбеддингах. Это позволяет выявлять скрытые связи между различными треками, которые могут быть неочевидны при традиционном анализе, но разделяют общие музыкальные элементы, вызывающие повторное прослушивание. Техническая реализация включает модификацию механизма внимания в архитектуре RecJPQ для учета суб-ID уровневых персонализированных оценок популярности. Это достигается через внедрение специализированного слоя, который динамически корректирует веса внимания на основе исторических паттернов использования суб-элементов. Такой подход обеспечивает явный контроль баланса между точностью рекомендаций и внедрением персонализированной новизны, позволяя систематически регулировать степень эксплорации нового контента в зависимости от контекста и предпочтений конкретного пользователя. ## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ Экспериментальная валидация проводилась на обширных наборах данных, включающих миллионы взаимодействий пользователей с музыкальным контентом из реальных стриминговых платформ. Исследование использовало стандартные метрики оценки качества рекомендаций, включая Precision@K, Recall@K, NDCG@K для измерения точности, а также специализированные метрики для оценки новизны и серендипитности рекомендаций. Ключевым результатом стало стабильное превосходство предложенного метода sPPS (sub-ID level Personalised Popularity Scores) над традиционным подходом PPS на уровне целых композиций. Конкретно, sPPS продемонстрировал статистически значимое улучшение по метрикам персонализированной нов

Annotation:

In the realm of music recommendation, sequential recommenders have shown promise in capturing the dynamic nature of music consumption. A key characteristic of this domain is repetitive listening, where users frequently replay familiar tracks. To capture these repetition patterns, recent research has introduced Personalised Popularity Scores (PPS), which quantify user-specific preferences based on historical frequency. While PPS enhances relevance in recommendation, it often reinforces already-kn...

ID: 2508.05198v1 cs.IR, cs.AI

arXiv PDF

📄 Multi-Modal Multi-Behavior Sequential Recommendation with Conditional Diffusion-Based Feature Denoising

2025-08-09

Авторы:

Xiaoxi Cui, Weihai Lu, Yu Tong, Yiheng Li, Zhejun Zhao

## КОНТЕКСТ И ПРОБЛЕМАТИКА Секвенциальные системы рекомендаций играют ключевую роль в прогнозировании пользовательских предпочтений, основываясь на истории взаимодействий. Однако существуют существенные проблемы, связанные с интеграцией разнообразных пользовательских поведений и многомодальной информации об элементах. Данная статья фокусируется на мультимодальной секвенциальной рекомендации, которая призвана решить несколько ключевых проблем. Во-первых, неэффективная характеризация модальных предпочтений у разных типов поведения. Пользовательское внимание к разным модальностям (например, изображениям, текстам, видео) может значительно варьироваться в зависимости от типа поведения, что усложняет создание точных моделей. Во-вторых, существует проблема неявного шума в пользовательских данных, такого как случайные клики, которые могут исказить модель предпочтений. Наконец, шум в мультимодальных представлениях может существенно повлиять на качество моделирования пользовательских предпочтений. Эти вызовы демонстрируют необходимость разработки новых подходов, способных эффективно решать проблемы шума в модальных и поведенческих данных, а также точно извлекать интересы пользователя на основе мультимодальной информации. ## ПРЕДЛОЖЕННЫЙ МЕТОД Чтобы решить эти проблемы, авторы предлагают новую модель **Multi-Modal Multi-Behavior Sequential Recommendation (M³BSR)**. Она состоит из трех ключевых компонентов. 1. **Conditional Diffusion Modality Denoising Layer**: Этот слой удаляет шум из мультимодальных представлений. Он использует кондиционирующую диффузию для того, чтобы очистить модальные данные от шума, который может влиять на качество моделирования пользовательских предпочтений. 2. **Conditional Diffusion Behavior Denoising**: Этот компонент очищает шум из неявного поведения пользователя, такого как непреднамеренные действия. Он использует глубокую информацию о поведении для того, чтобы руководить очисткой данных, связанных с более поверхностными поведенческими моделями. 3. **Multi-Expert Interest Extraction Layer**: Этот слой моделирует общие и специфические интересы пользователя на основе различных модальностей и типов поведения. Это позволяет модели точнее представлять пользовательские предпочтения. ## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ Авторы провели ряд экспериментов на различных бенчмарк-данных, чтобы оценить эффективность модели M³BSR. Результаты показали, что M³BSR значительно превосходит существующие состояния искусства в секвенциальной рекомендации. Модель демонстрирует высокую точность в прогнозировании пользовательских предпочтений, особенно при работе с мультимодальными данными и при наличии шума в пользовательских поведениях. ## ПРАКТИЧЕСКАЯ ЗНАЧИМОСТЬ Модель M³BSR имеет широкое применение в сфере электронной коммерции, рекламы и других областях, где необходимо точно предсказывать пользовательские предпочтения. Она позволяет эффективно обрабатывать мультимодальные данные, уменьшая влияние шума и улучшая качество рекомендаций. Это может привести к более эффективной личностной рекламе, повышенному вовлеченности пользователей и повышенной эффективности рекомендательных систем. ## ВЫВОДЫ И ПЕРСПЕКТИВЫ В статье представлена модель M³BSR, которая эффективно решает проблемы шума в модальных и поведенческих данных. Будущие исследования могут фокусироваться на дальнейшем улучшении эффективности диффузионных слоев и на применении этого подхода к другим областям, где мультимодальные данные играют ключевую роль.

Annotation:

The sequential recommendation system utilizes historical user interactions to predict preferences. Effectively integrating diverse user behavior patterns with rich multimodal information of items to enhance the accuracy of sequential recommendations is an emerging and challenging research direction. This paper focuses on the problem of multi-modal multi-behavior sequential recommendation, aiming to address the following challenges: (1) the lack of effective characterization of modal preferences ...

ID: 2508.05352v1 cs.IR, cs.AI

arXiv PDF

📄 KuaiLive: A Real-time Interactive Dataset for Live Streaming Recommendation

2025-08-08

Авторы:

Changle Qu, Sunhao Dai, Ke Guo, Liqin Zhao, Yanan Niu, Xiao Zhang, Jun Xu

## КОНТЕКСТ И ПРОБЛЕМАТИКА Современные платформы стриминга переживают беспрецедентный рост, превращаясь из нишевого развлечения в доминирующий формат потребления онлайн-контента. Уникальность живых трансляций заключается в трех ключевых характеристиках: динамично изменяющемся контенте, реальном времени взаимодействия между зрителями и стримерами, а также высокой степени вовлечения аудитории. Эти особенности создают фундаментально новые вызовы для систем рекомендаций, которые невозможно адекватно решать традиционными методами, разработанными для статического контента вроде видео на YouTube или товаров в e-commerce. Академическое сообщество сталкивается с критическим барьером в развитии этой области – отсутствием качественных публичных датасетов, которые бы точно отражали динамическую природу сред стриминга. Существующие открытые данные либо не содержат информации о временных рамках трансляций, либо игнорируют многотипные взаимодействия пользователей, либо не предоставляют достаточного контекста о пользователях и стримерах. Это приводит к тому, что большинство исследований проводится на синтетических или частичных данных, что резко ограничивает воспроизводимость результатов и практическую применимость разработанных алгоритмов. Индустрия, обладающая доступом к реальным данным, значительно опережает академию в понимании и решении специфических задач рекомендаций в живом стриминге. ## ПРЕДЛОЖЕННЫЙ МЕТОД Для преодоления разрыва между академией и индустрией авторы разработали KuaiLive – первый в своем роде набор данных, собранный с крупнейшей китайской платформы живых трансляций Kuaishou с аудиторией более 400 миллионов активных пользователей в день. Методология сбора данных была специально спроектирована для захвата всех ключевых аспектов реального взаимодействия пользователей с живым контентом. Датасет охватывает 21-дневный период и содержит детальные логи взаимодействий 23,772 уникальных пользователей с 452,621 стримером. Ключевое техническое решение заключается в точной временной привязке всех событий – авторы записывают точные временные метки начала и окончания каждой трансляции, что позволяет точно моделировать динамику доступного контента. В отличие от существующих решений, KuaiLive включает четыре типа взаимодействий: клики (переход в комнату стримера), комментарии, лайки и отправка виртуальных подарков. Это многоаспектное поведение пользователей позволяет исследовать сложные паттерны вовлеченности. Архитектура данных включает богатую контекстную информацию: демографические и поведенческие признаки пользователей, метаданные стримеров (категория контента, историческая популярность), а также временные характеристики трансляций. Специальное внимание уделено приватности – все идентификаторы были анонимизированы, а чувствительная информация удалена в соответствии с политикой платформы. ## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ Комплексный анализ датасета выявил ранее неизвестные паттерны поведения в экосистеме живого стриминга. Статистический анализ показал, что пользователи демонстрируют крайне нестабильный паттерн просмотра – средняя продолжительность пребывания в комнате составляет всего 3.2 минуты, но 5% самых вовлеченных пользователей проводят в стримах более 2 часов в день. Распределение взаимодействий экспоненциально, где 20% стримеров получают 80% всех взаимодействий, что создает значительные вызовы для обеспечения справедливости рекомендаций. Авторы провели систематическую оценку представительных методов рекомендаций на KuaiLive, включая коллаборативную фильтрацию, графовые нейронные сети и последовательные модели. Лучшие результаты показала адаптированная модель GRU4Rec с учетом временной динамики, достигшая MAP@10 = 0.247 для задачи топ-K рекомендаций. Интересно, что традиционные методы, показывающие высокую эффективность на статических данных, продемонстрировали значительное падение производительности (до 40% по NDCG), подчеркивая фундаментальные различия между статическим и живым контентом. Отдельные эксперименты были проведены для задач прогнозирования времени просмотра (RMSE = 1.34 минуты) и стоимости подарков (средняя абсолют

Annotation:

Live streaming platforms have become a dominant form of online content consumption, offering dynamically evolving content, real-time interactions, and highly engaging user experiences. These unique characteristics introduce new challenges that differentiate live streaming recommendation from traditional recommendation settings and have garnered increasing attention from industry in recent years. However, research progress in academia has been hindered by the lack of publicly available datasets t...

ID: 2508.05633v1 cs.IR, cs.AI

arXiv PDF

📄 HiD-VAE: Interpretable Generative Recommendation via Hierarchical and Disentangled Semantic IDs

2025-08-08

Авторы:

Dengzhao Fang, Jingtong Gao, Chengcheng Zhu, Yu Li, Xiangyu Zhao, Yi Chang

## КОНТЕКСТ И ПРОБЛЕМАТИКА Рекомендательные системы являются ключевым элементом современных онлайн-платформ, позволяющих пользователям эффективно ориентироваться в обширных каталогах товаров, сервисов или контента. В последнее время генеративные рекомендательные системы привлекли значительное внимание, так как они позволяют объединить традиционные этапы "поиска и ранжирования" в единый конечно-этапный процесс, основанный на динамическом генерировании рекомендаций. Однако существующие генеративные методы сталкиваются с серьёзными ограничениями, связанными с их неконтролируемым токенизационным процессом. Этот процесс приводит к формированию семантических идентификаторов (Semantic IDs), которые имеют две критические проблемы. Во-первых, семантические ID являются "плоскими" и неинтерпретируемыми, не имеющими чёткой иерархической структуры. Это ограничивает возможность понимания их семантического контекста. Во-вторых, эти идентификаторы подвержены проблеме "пересечения представлений" (ID collisions), которая влечёт за собой неточность и снижение разнообразия рекомендаций. Такие недостатки существенно ограничивают эффективность и качество генеративных рекомендательных моделей. Для решения этих проблем авторы предлагают HiD-VAE, новый фреймворк, который позволяет получать иерархически десентрализованные (disentangled) представления товаров или контента. Эта модель нацелена на улучшение качества и интерпретируемости семантических ID, что является важной задачей для улучшения точности и разнообразия генеративных рекомендаций. ## ПРЕДЛОЖЕННЫЙ МЕТОД HiD-VAE представляет собой инновационный фреймворк, основанный на двух основных инновационных компонентах. Во-первых, HiD-VAE использует **иерархически контролируемый квантизационный процесс** (hierarchically-supervised quantization), который выравнивает дискретные коды с многоуровневыми тегами товаров. Это позволяет получить более униформные и десентрализованные идентификаторы. Особенно важной характеристикой этого процесса является то, что обученные кодобуки (codebooks) могут предсказывать иерархические теги, обеспечивая прозрачный и интерпретируемый семантический путь для каждой рекомендации. Во-вторых, для борьбы с проблемой "пересечения представлений" HiD-VAE использует **новую функцию потерь "уникальности"** (uniqueness loss), которая напрямую штрафует за перекрытие в латентном пространстве. Это позволяет не только устранить проблему ID collisions, но и повысить разнообразие рекомендаций за счёт более полного использования пространства представлений. ## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ Авторы провели исследования на трёх общедоступных наборах данных, чтобы продемонстрировать эффективность HiD-VAE по сравнению со стандартными методами. Результаты показали, что HiD-VAE превосходит современные методы по ключевым метрикам, таким как точность рекомендаций, разнообразие и интерпретируемость. ## ПРАКТИЧЕСКАЯ ЗНАЧИМОСТЬ HiD-VAE может быть применён в различных областях, где важна качественная и интерпретируемая рекомендация, таких как электронная коммерция, развлекательные платформы и системы контент-рекомендаций. Благодаря его способности генерировать высококачественные и десентрализованные идентификаторы, HiD-VAE может улучшить качество рекомендаций и повысить доверие пользователей к системам. ## ВЫВОДЫ И ПЕРСПЕКТИВЫ HiD-VAE является важным шагом в развитии генеративных рекомендательных систем, предлагая более точные и интерпретируемые семантические идентификаторы. В будущем этот метод может быть расширен для работы с более сложными иерархиями данных или для интеграции с другими генеративными моделями.

Annotation:

Recommender systems are indispensable for helping users navigate the immense item catalogs of modern online platforms. Recently, generative recommendation has emerged as a promising paradigm, unifying the conventional retrieve-and-rank pipeline into an end-to-end model capable of dynamic generation. However, existing generative methods are fundamentally constrained by their unsupervised tokenization, which generates semantic IDs suffering from two critical flaws: (1) they are semantically flat a...

ID: 2508.04618v1 cs.IR, cs.AI

arXiv PDF

📄 Query Attribute Modeling: Improving search relevance with Semantic Search and Meta Data Filtering

2025-08-08

Авторы:

Karthik Menon, Batool Arhamna Haider, Muhammad Arham, Kanwal Mehreen, Ram Mohan Rao Kadiyala, Hamza Farooq

## КОНТЕКСТ И ПРОБЛЕМАТИКА В современных системах поиска, особенно в контексте электронной коммерции, ключевым фактором является обеспечение высокой релевантности поисковых результатов. Традиционные методы поиска, такие как BM25 и другие ключевословные подходы, часто сталкиваются с ограничениями в том, что они не учитывают семантические отношения между запросом и документами. Это приводит к появлению шума в результатах поиска и снижению эффективности для конечных пользователей. Дополнительно, существует проблема неструктурированности запросов пользователей, которые могут содержать различные типы информации, такие как названия товаров, характеристики, цены, или другие атрибуты, которые не всегда могут быть эффективно обработаны с помощью традиционных подходов поиска. В контексте Enterprise Search, который широко используется в системах электронной коммерции, эти ограничения становятся еще более критичными. Необходимо разработать более продвинутые методы, которые могут эффективно обрабатывать неструктурированные данные, извлекать семантические элементы и метаданные из запросов пользователей, и предоставлять более точные и релевантные результаты. Одной из возможных путей решения этой проблемы является интеграция семантического поиска с фильтрацией метаданных, что позволяет улучшить качество поиска за счет более точного понимания пользовательских интенций. ## ПРЕДЛОЖЕННЫЙ МЕТОД Query Attribute Modeling (QAM) представляет собой гибридный фреймворк, который объединяет семантический поиск с фильтрацией метаданных для улучшения точности и релевантности результатов поиска. Основная идея QAM заключается в разделении неструктурированных текстовых запросов на структурированные метаданные и семантические компоненты. Это достигается путем автоматического извлечения метаданных и фильтров из запросов, что позволяет уменьшить шум и сосредоточиться на наиболее релевантных элементах. Архитектура QAM включает несколько этапов обработки. Первым шагом является предобработка запроса, в которой используются техники естественного языка для идентификации ключевых компонентов запроса. Затем, QAM применяет модели извлечения метаданных для определения атрибутов товаров, таких как цена, бренд, размер, и т.д., которые могут быть использованы для фильтрации результатов. На следующем этапе, QAM использует семантическую модель для определения связей между запросом и документами, что позволяет выявить релевантные элементы, даже если они не содержат точных ключевых слов. ## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ Для оценки эффективности QAM был использован датасет Amazon Toys Reviews, содержащий около 10 000 уникальных товаров и более 40 000 отзывов. Эксперименты проводились с использованием различных методов поиска, включая BM25, семантический поиск на основе энкодеров, кросс-энкодеры для переранжирования, и гибридный поиск, который комбинирует BM25 и семантические результаты через Reciprocal Rank Fusion (RRF). Результаты показали, что QAM достигает средней точности (mAP@5) в 52.99%, что значительно превосходит результаты других методов. Например, BM25 достигает точности в 38.12%, в то время как семантический поиск на основе энкодеров показывает 46.89%. Эти результаты подтверждают, что QAM является более эффективным подходом для улучшения релевантности поиска в контексте электронной коммерции. ## ПРАКТИЧЕСКАЯ ЗНАЧИМОСТЬ Практическая значимость QAM заключается в его потенциале для улучшения качества поиска в системах электронной коммерции. Благодаря возможности извлекать метаданные и семантические компоненты из запросов, QAM позволяет создавать более точные и целевые результаты поиска, что может повысить удовлетворенность пользователей и повысить конверсию в системах онлайн-торговли. Более того, QAM может быть интегрирован в существующие Enterprise Search системы, что делает его применимым в различных отраслях, где критична точность поиска. ## ВЫВОДЫ И ПЕРСПЕКТИВЫ В итоге, Query Attribute Modeling (QAM) представляет собой эффективное решение для улучшения поисковой релевантности в системах электронной коммерции. Будущие исследования могут фокусироваться на дальнейшем улучшении моделей извлечения метаданных и семантического поиска, а также на расширении применения QAM в других областях, таких как медицинские системы поиска или корпоративные базы данных.

Annotation:

This study introduces Query Attribute Modeling (QAM), a hybrid framework that enhances search precision and relevance by decomposing open text queries into structured metadata tags and semantic elements. QAM addresses traditional search limitations by automatically extracting metadata filters from free-form text queries, reducing noise and enabling focused retrieval of relevant items. Experimental evaluation using the Amazon Toys Reviews dataset (10,000 unique items with 40,000+ reviews and de...

ID: 2508.04683v1 cs.IR, cs.AI, cs.CL, cs.LG

arXiv PDF

📄 Reliable Evaluation Protocol for Low-Precision Retrieval

2025-08-06

Авторы:

Kisu Yang, Yoonna Jang, Hwanseok Jang, Kenneth Choi, Isabelle Augenstein, Heuiseok Lim

В статье рассматривается проблема нестабильности оценки релевантности в низкоточностных системах поискового поиска, вызвана при использовании низкой точности вычислений. Уменьшение точности приводит к появлению случайных совпадений (spurious ties) между запросом и документами, что существенно влияет на результаты оценки. Для решения этой проблемы предложена новая протокол оценки, включающий два ключевых компонента: **High-Precision Scoring (HPS)** — применение высокоточных вычислений на последнем этапе оценки для разрешения случайных совпадений с минимальными затратами вычислений, и **Tie-aware Retrieval Metrics (TRM)** — метрики, которые учитывают вероятность совпадений и позволяют оценить неопределенность в результатах. Эксперименты на двух наборах данных показали, что HPS значительно снижает нестабильность, а TRM точно восстанавливают ожидаемые значения метрик. Объединение этих подходов обеспечивает более надежную и последовательную оценку в системах низкоточностного поиска.

Annotation:

Lowering the numerical precision of model parameters and computations is widely adopted to improve the efficiency of retrieval systems. However, when computing relevance scores between the query and documents in low-precision, we observe spurious ties due to the reduced granularity. This introduces high variability in the results based on tie resolution, making the evaluation less reliable. To address this, we propose a more robust retrieval evaluation protocol designed to reduce score variation...

ID: 2508.03306v1 cs.IR, cs.AI, cs.CL

arXiv PDF

1
2
19
20
21
22

Показано 201 - 210 из 211 записей