📊 Статистика дайджестов

Всего дайджестов: 34123 Добавлено сегодня: 0

Последнее обновление: сегодня

📄 Graph Embedding in the Graph Fractional Fourier Transform Domain

2025-08-09

Авторы:

Changjie Sheng, Zhichao Zhang, Wei Yao

## Контекст Графовые данные широко используются в различных областях, включая социальные сети, биоинформатику и моделирование сетей. Одним из ключевых задач в области графовых представлений является спектральное графовое вложение (Spectral Graph Embedding), которое позволяет генерировать низкоразмерные векторные представления графов на основе спектральной информации. Однако, существующие методы часто ограничиваются ограниченной выразительностью в сфере графовых представлений, недостаточно учитывая латентные структурные признаки в альтернативных доменах. Эта проблема мотивирует разработку методов, которые могут расширить спектральный анализ на дополнительные домены, такие как графовое фрактальное преобразование Фурье. ## Метод Метод, представленный в статье, заключается в расширении технологии графового фильтрационного вложения (Generalized Frequency Filtering Embedding, GEFFE) в графовом фрактальном домене Фурье. Это приводит к разработке метода генерирования вложений на основе фрактального графового преобразования Фурье (Graph Fractional Fourier Transform Domain, GEFRFE). Главная идея заключается в использовании фильтрации в домене фрактального графового преобразования Фурье, а также в составной модели, основанной на собственных компонентах относительно фрактального лапласиана графа. Для определения фрактального порядка вводятся два подхода: оптимизация с поиском и адаптивное обучение с использованием сети ResNet18. Это позволяет адаптировать порядок графового преобразования Фурье в зависимости от конкретных данных. ## Результаты Для проверки эффективности подхода проведены эксперименты на шести бенчмарк-датасетах. Результаты показывают, что GEFRFE способен лучше всего локализовать латентные структурные признаки в альтернативных доменах, включая фрактальный домен Фурье. Это приводит к улучшению качества классификации и глубжей интерпретации данных. Эксперименты также показывают, что GEFRFE обладает высокой скоростью и эффективностью, что делает его приемлемым для применения в реальных задачах. ## Значимость Метод GEFRFE может применяться в различных областях, где требуется эффективная обработка графовых данных, включая социальные сети, биоинформатику, сетевое моделирование и другие. Он предоставляет преимущества в том, что позволяет сгенерировать более вы expressive вложения, что позволяет лучше учитывать латентные структурные признаки. Это может привести к повышению эффективности в задачах классификации и рекомендаций, а также способствовать развитию новых подходов в области графовых представлений. ## Выводы Результаты исследования показали, что GEFRFE значительно

Annotation:

Spectral graph embedding plays a critical role in graph representation learning by generating low-dimensional vector representations from graph spectral information. However, the embedding space of traditional spectral embedding methods often exhibit limited expressiveness, failing to exhaustively capture latent structural features across alternative transform domains. To address this issue, we use the graph fractional Fourier transform to extend the existing state-of-the-art generalized frequen...

ID: 2508.02383v1 cs.LG, cs.IR

arXiv PDF

📄 Defending Against Knowledge Poisoning Attacks During Retrieval-Augmented Generation

2025-08-09

Авторы:

Kennedy Edemacu, Vinay M. Shashidhar, Micheal Tuape, Dan Abudu, Beakcheol Jang, Jong Wook Kim

#### Контекст Retrieval-Augmented Generation (RAG) является мощным подходом для повышения функциональных возможностей бо LLM (больших языковых моделей), используя внешнюю, актуальную информацию. Однако это позволяет появиться проблему, такая как злоупотребление записью в знаниях, когда злоумышленники могут подвергнуться компрометации знаний, чтобы сбить модель с толку. Одним из таких атак является PoisonedRAG, где внедренные вредоносные тексты принуждают модель к генерации ответа, который выбрал атакующий, на целевой вопрос. В данной работе мы предлагаем новые методы защиты, FilterRAG и ML-FilterRAG, чтобы снизить риски PoisonedRAG. #### Метод Мы разработали два основных подхода для обнаружения и отсечения злоумышленников в знаниях. Одно из них, FilterRAG, использует новую свойство-анализирующую технику для различения между вредоносными и чистыми текстами в источнике знаний. Другой подход, ML-FilterRAG, использует машинное обучение для обнаружения и отсечения вредоносных текстов. Оба подхода основываются на определении определенных признаков, которые отличают вредоносные тексты от чистых. Мы оценили эти методы с помощью различных наборов данных и проверили их эффективность. #### Результаты Проведенные эксперименты показали, что FilterRAG и ML-FilterRAG эффективно отсекают вредоносные тексты, сохраняя высокую точность и избегая потери качества в RAG-системах. В результате, по окончании экспериментов, показатели RAG-систем, использующих защиту, приближались к отношениям в оригинальной RAG-системе. Эти результаты подтверждают, что наши новые методы эффективно контрят злоупотребление записями в знаниях и обеспечивают безопасность генерируемых ответов. #### Значимость Предложенные методы могут использоваться в различных приложениях, которые полагаются на RAG-системы, такие как системы рекомендаций, поисковые системы и генераторы ответов. Наш подход обеспечивает увеличение безопасности и точности генерируемых ответов, уменьшая риск заражения нотацией в знаниях. Это повышает надежность и уверенность пользователей в системах, которые используют RAG. #### Выводы В данной работе мы предложили эффективные методы защиты от злоупотреблений записями в знаниях в RAG-системах. Наши результаты показали, что FilterRAG и ML-FilterRAG способны успешно отсекать вредоносные тексты, сохраняя качество генерируемых ответов. В будущем мы планируем расширить эти методы, чтобы они могли применяться к другим видам атак и повысить еще больше безопасность в подобных системах.

Annotation:

Retrieval-Augmented Generation (RAG) has emerged as a powerful approach to boost the capabilities of large language models (LLMs) by incorporating external, up-to-date knowledge sources. However, this introduces a potential vulnerability to knowledge poisoning attacks, where attackers can compromise the knowledge source to mislead the generation model. One such attack is the PoisonedRAG in which the injected adversarial texts steer the model to generate an attacker-chosen response to a target qu...

ID: 2508.02835v1 cs.LG, cs.IR

arXiv PDF

📄 NAEx: A Plug-and-Play Framework for Explaining Network Alignment

2025-08-09

Авторы:

Shruti Saxena, Arijit Khan, Joydeep Chandra

## Контекст Network alignment (NA) — это процесс идентификации корреспондирующих узлов в нескольких сетях. Он находит применение в областях, таких как социальные сети, сотрудничество авторов и биология. Несмотря на развитие моделей для осуществления такого выравнивания, их понятность и интерпретируемость остаются неудовлетворительными. Эти ограничения способствуют сложностям в построении доверия, особенно в высокорисковых областях. Более того, существующие модели часто оказываются контекстуально зависимыми, что усложняет общую эффективность и точность. Данные ограничения побудили авторов разработать NAEx — модель, которая предлагает мощный инструмент для повышения понятности моделей выравнивания сетей. ## Метод NAEx — это модель, оперирующая вне модели, что позволяет использовать ее совместно с различными моделями выравнивания сетей. Она использует два основных компонента: параметризацию графовых структур и пространств признаков с помощью обучаемых масок для ребер и признаков, а также инновационный подход к оптимизации, который обеспечивает лояльность к оригинальным предсказаниям и позволяет проводить структурные и признаковые сравнения между сетями. Этот подход предлагает не только повышенную понятность, но и эффективность, так как работает независимо от используемой модели выравнивания. ## Результаты Авторы провели эксперименты на нескольких широко известных датасетах, используя NAEx в сочетании с четырьмя различными моделями выравнивания сетей. Использование метрик, разработанных специально для оценки понятности выравнивания, позволило показать, что NAEx эффективно объясняет решения моделей и повышает понимание процесса выравнивания. Это демонстрирует мощь модели в улучшении доверия и эффективности в применении моделей выравнивания. ## Значимость Помимо применения в обычных сетях, NAEx может быть применена в сложных сетевых задачах, таких как выявление нарушений, анализ социальных сетей, или мониторинг зависимостей в биологичных сетях. Модель обеспечивает лучшую прозрачность и контекстуальную поддержку, что увеличивает ее применяемость в высокорисковых областях, где интерпретируемость критична. Таким образом, NAEx открывает путь к более ответственному и эффективному использованию моделей выравнивания сетей. ## Выводы Авторы подчеркивают, что NAEx — это прорыв в области понимания интерпретируемости моделей выравнивания сетей. На основе полученных результатов, они планируют расширить применение модели к более сложным сетевым задачам и улучшить ее поддержку для более широкого круга моделей и сетей. Настоящие достижения NAEx открывают новые перспективы в исследованиях в области выравнива

Annotation:

Network alignment (NA) identifies corresponding nodes across multiple networks, with applications in domains like social networks, co-authorship, and biology. Despite advances in alignment models, their interpretability remains limited, making it difficult to understand alignment decisions and posing challenges in building trust, particularly in high-stakes domains. To address this, we introduce NAEx, a plug-and-play, model-agnostic framework that explains alignment models by identifying key sub...

ID: 2508.04731v1 cs.LG, cs.IR, cs.SI

arXiv PDF

📄 Federated Continual Recommendation

2025-08-09

Авторы:

Jaehyung Lim, Wonbin Kweon, Woojoo Kim, Junyoung Kim, Seongjin Choi, Dongha Kim, Hwanjo Yu

**Резюме** В современных рекомендательных системах становится все важнее обеспечивать приватность пользователей, что привело к развитию Federated Learning (FL). Однако FL в рекомендательных системах (FedRec) сталкивается с проблемой изменения пользовательских предпочтений в нестационарных потоках данных, что приводит к неустойчивости качества рекомендаций. Индивидуальные подходы Continual Learning (CLRec) успешно решают эту проблему, но требуют централизованного доступа к данным, что несовместимо с ограничениями FL. Мы предлагаем Federated Continual Recommendation (FCRec) — новую задачу, комбинирующую FedRec и CLRec, с меткой F3CRec. Фреймворк F3CRec решает эту проблему за счет двух основных компонентов: Adaptive Replay Memory, который адаптивно сохраняет важные предпочтения пользователя, и Item-wise Temporal Mean, объединяющий новую информацию с учетом предыдущего опыта. Эксперименты показали, что F3CRec существенно избегает утери качества рекомендаций в FL, обеспечивая эффективный баланс между сохранением и адаптацией.

Annotation:

The increasing emphasis on privacy in recommendation systems has led to the adoption of Federated Learning (FL) as a privacy-preserving solution, enabling collaborative training without sharing user data. While Federated Recommendation (FedRec) effectively protects privacy, existing methods struggle with non-stationary data streams, failing to maintain consistent recommendation quality over time. On the other hand, Continual Learning Recommendation (CLRec) methods address evolving user preferenc...

ID: 2508.04792v1 cs.LG, cs.IR, H.3.3; I.2.6; C.2.4

arXiv PDF

📄 Bidding-Aware Retrieval for Multi-Stage Consistency in Online Advertising

2025-08-09

Авторы:

Bin Liu, Yunfei Liu, Ziru Xu, Zhaoyu Zhou, Zhi Kou, Yeqiu Yang, Han Zhu, Jian Xu, Bo Zheng

**Резюме** В современных системах онлайн-рекламы используется каскадная архитектура для обработки массивных запросов и рекламных кандидатов. Несмотря на то, что рекомендации выдачи рекламы определяются на основе eCPM (predicted CTR $\times$ Bid), возникает проблема несоответствия между вычислительно требовательным этапом рекламного ретривала и стадиями ранжирования. Этому способствует появление auto-bidding стратегий, которые не предоставляют точных в реальном времени сигналов биддинга в этапе ретривала. Это приводит к ухудшению объема рекламных впечатлений и эффективности рекламодателей. Мы предлагаем Bidding-Aware Retrieval (BAR) — модельно-ориентированный фреймворк, решающий проблему несоответствия в ретриве-ранжировании. BAR включает бид-столбец в рекомендательный скоринг и использует monotonicity-constrained learning и multi-task distillation для обеспечения экономически когерентных представлений. Асинхронная ближе-строго-линейная инференция позволяет эффективно обновлять каркас эмбеддингов под рыночной динамикой. Также, Task-Attentive Refinement модуль улучшает взаимодействия признаков, отделяя упорство пользователя и коммерческое значение. Наши offline инспекции и реализация в рабочем окружении Alibaba's display advertising подтвердили высокую эффективность BAR: +4.32% дохода платформы и +22.2% впечатлений для продвинутых рекламодателей.

Annotation:

Online advertising systems typically use a cascaded architecture to manage massive requests and candidate volumes, where the ranking stages allocate traffic based on eCPM (predicted CTR $\times$ Bid). With the increasing popularity of auto-bidding strategies, the inconsistency between the computationally sensitive retrieval stage and the ranking stages becomes more pronounced, as the former cannot access precise, real-time bids for the vast ad corpus. This discrepancy leads to sub-optimal platfo...

ID: 2508.05206v1 cs.LG, cs.IR

arXiv PDF

Показано 31 - 35 из 35 записей