📊 Статистика дайджестов

Всего дайджестов: 34123 Добавлено сегодня: 0

Последнее обновление: сегодня
Авторы:

Iman Deznabi, Peeyush Kumar, Madalina Fiterau

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Zero-shot forecasting aims to predict outcomes for previously unseen conditions without direct historical data, posing a significant challenge for traditional forecasting methods. We introduce a Resolution-Aware Retrieval-Augmented Forecasting model that enhances predictive accuracy by leveraging spatial correlations and temporal frequency characteristics. By decomposing signals into different frequency components, our model employs resolution-aware retrieval, where lower-frequency components re...
ID: 2510.16695v1 cs.LG, cs.IR
Авторы:

Rashmi R, Vidyadhar Upadhya

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Current Retrieval-Augmented Generation (RAG) systems primarily operate on unimodal textual data, limiting their effectiveness on unstructured multimodal documents. Such documents often combine text, images, tables, equations, and graphs, each contributing unique information. In this work, we present a Modality-Aware Hybrid retrieval Architecture (MAHA), designed specifically for multimodal question answering with reasoning through a modality-aware knowledge graph. MAHA integrates dense vector re...
ID: 2510.14592v1 cs.LG, cs.IR
Авторы:

Moyu Zhang, Yun Chen, Yujun Jin, Jinxin Hu, Yu Zhang, Xiaoyi Zeng

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Recently, a growing body of research has focused on either optimizing CTR model architectures to better model feature interactions or refining training objectives to aid parameter learning, thereby achieving better predictive performance. However, previous efforts have primarily focused on the training phase, largely neglecting opportunities for optimization during the inference phase. Infrequently occurring feature combinations, in particular, can degrade prediction performance, leading to unre...
ID: 2510.08932v1 cs.LG, cs.IR
Авторы:

Hyunin Lee, Yong Zhang, Hoang Vu Nguyen, Xiaoyi Liu, Namyong Park, Christopher Jung, Rong Jin, Yang Wang, Zhigang Wang, Somayeh Sojoudi, Xue Feng

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Cross-domain sequential recommendation (CDSR) aims to align heterogeneous user behavior sequences collected from different domains. While cross-attention is widely used to enhance alignment and improve recommendation performance, its underlying mechanism is not fully understood. Most researchers interpret cross-attention as residual alignment, where the output is generated by removing redundant and preserving non-redundant information from the query input by referencing another domain data which...
ID: 2510.09435v1 cs.LG, cs.IR
Авторы:

Majid Jaberi-Douraki, Hossein Sholehrasa, Xuan Xu, Remya Ampadi Ramachandran

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
The extraction and standardization of pharmacokinetic (PK) information from scientific literature remain significant challenges in computational pharmacology, which limits the reliability of data-driven models in drug development. Large language models (LLMs) have achieved remarkable progress in text understanding and reasoning, yet their adaptation to structured biomedical data, such as PK tables, remains constrained by heterogeneity, noise, and domain shift. To address these limitations, we pr...
ID: 2510.07796v1 cs.LG, cs.IR
Авторы:

Rohith Mahadevan

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Analytics play an important role in modern business. Companies adapt data science lifecycles to their culture to seek productivity and improve their competitiveness among others. Data science lifecycles are fairly an important contributing factor to start and end a project that are data dependent. Data science and Machine learning life cycles comprises of series of steps that are involved in a project. A typical life cycle states that it is a linear or cyclical model that revolves around. It is ...
ID: 2510.06987v1 cs.LG, cs.IR, cs.SE
Авторы:

Mariano Tepper, Ted Willke

#### Контекст В последние годы векторные поисковые технологии стали важной частью обработки неструктурированных данных, таких как текст, изображения и аудио. Эти технологии позволяют находить точные или семантически похожие элементы с помощью вычисления векторных представлений. Однако векторы, используемые для такого представления, часто имеют высокую размерность, что приводит к значительным затратам на хранение и обработку данных. Это создает ряд проблем, в том числе увеличение нагрузки на память и стоимости хранения. В данной работе мы предлагаем NVQ (non-uniform vector quantization), новую методику сжатия векторов, которая эффективна как в плане вычислений, так и в плане памяти, особенно при высоких требованиях к точности. #### Метод NVQ основывается на применении нелинейных, параметризируемых функций, которые позволяют создавать неуниформные квантоверторы. Изначально векторы сжимаются с помощью этих функций, а затем квантование производится с учетом нелинейных преобразований. Основная идея заключается в том, что каждый вектор индексируется особым образом, чтобы уменьшить затраты на хранение и обработку. Затем, для каждого вектора индекса настраивается парсиммонная функция, обеспечивающая высокую точность в данных областях. Эта техника позволяет достичь высокой точности с минимальными затратами. #### Результаты Мы проводили эксперименты с NVQ, сравнивая его с другими методами квантования векторов, такими как uniform quantization и PQ (product quantization). Наши результаты показали, что NVQ предоставляет значительное улучшение точности в поиске похожих элементов с минимальными затратами на вычисления. Например, в тестах с поиском семантически похожих векторов, NVQ показал значительное улучшение в точности в сравнении с PQ. Этого достиглось благодаря тому, что NVQ использует индивидуально настроенные нелинейные квантоверторы для каждого вектора, что позволяет минимизировать потери точности при сжатии. #### Значимость NVQ может быть применено в различных областях, таких как видеонаблюдение, транспортная система, системы рекомендаций и машинное обучение. Одним из ключевых преимуществ является снижение стоимости хранения векторных данных без потери точности. NVQ также обеспечивает высокую скорость поиска, что делает его привлекательным для реального времени интерактивных систем. Благодаря своему подходу, NVQ может существенно улучшить эффективность и экономичность систем поиска и рекомендаций в сложных неструктурированных данных. #### Выводы В данной работе мы представили NVQ, новую методику квантования векторов, которая достигает высокой точности с минимальными затратами на вычисления. Наша методика имеет большой
Annotation:
Embedding vectors are widely used for representing unstructured data and searching through it for semantically similar items. However, the large size of these vectors, due to their high-dimensionality, creates problems for modern vector search techniques: retrieving large vectors from memory/storage is expensive and their footprint is costly. In this work, we present NVQ (non-uniform vector quantization), a new vector compression technique that is computationally and spatially efficient in the h...
ID: 2509.18471v1 cs.LG, cs.IR
Авторы:

Ilyass Moummad, Kawtar Zaher, Lukas Rauch, Alexis Joly

## Контекст Поиск информации с использованием компактных бинарных векторов, так называемых хешированием, является ключевым инструментом для решения задач ускоренного поиска. Однако современные методы хеширования часто требуют дорогостоящей и специфичной для сценария обучения, что ограничивает их применение в более широких контекстах. Наблюдается необходимость в эффективных, простых и надежных подходах, которые могут использоваться в различных областях без трудоемкой настройки. ## Метод На основе современных моделей глубокого обучения, особенно тех, что основаны на предобученных энкодерах, авторы предлагают Hashing-Baseline. Этот метод не требует дополнительного обучения и основывается на классических техниках хеширования, таких как основные компоненты, случайные ортогональные проекции и терминальное бинарирование. Метод использует "фризированные" предобученные вектора из моделей для визуальных и звуковых данных, что позволяет получить высокую эффективность в поиске и сравнении информации без дополнительных трудозатрат на обучение. ## Результаты На ряде стандартных задач (например, изображения и звуковых файлов) Hashing-Baseline показал отличные результаты, подходящие по качеству к существующим тренируемым методам. Авторы проверили свои результаты на визуальных базах данных и ввели новую задачу для аудио-хеширования. Эта методика доказала свою обобщаемость и эффективность, даже при использовании "нативных" бинарных векторов без дополнительных модификаций. ## Значимость Предложенная система может быть применена в различных областях, где требуется быстрый поиск, например, в области визуального и аудио-контента. Она предлагает преимущество в своей простоте, быстродействии и не требует дополнительных ресурсов для обучения. Это может существенно упростить применение хеширования в реальном времени и на больших объемах данных. ## Выводы Hashing-Baseline демонстрирует, что предобученные модели могут быть эффективно использованы для хеширования без дополнительного обучения. Это открывает путь к более простой и доступной информационной системе. Будущие исследования могут сосредоточиться на оптимизации техник хеширования и исследовании их применения в новых задачах.
Annotation:
Information retrieval with compact binary embeddings, also referred to as hashing, is crucial for scalable fast search applications, yet state-of-the-art hashing methods require expensive, scenario-specific training. In this work, we introduce Hashing-Baseline, a strong training-free hashing method leveraging powerful pretrained encoders that produce rich pretrained embeddings. We revisit classical, training-free hashing techniques: principal component analysis, random orthogonal projection, and...
ID: 2509.14427v1 cs.LG, cs.IR
Авторы:

Geon Lee, Bhuvesh Kumar, Clark Mingxuan Ju, Tong Zhao, Kijung Shin, Neil Shah, Liam Collins

## Контекст Генерирующая рекомендация является ключевым компонентом персонализированных систем, предсказывающих будущие взаимодействия пользователей на основе истории их поведения. Одна из ключевых проблем при обучении таких моделей заключается в усложненном процессе подготовки данных, который включает в себя виды технических решений, таких как **процесс подготовки обучающих данных**. Этот процесс влияет на обучение модели, на ее поведение в рабочей среде и, в итоге, на ее точность и удовлетворение пользователей. Troppo длинно и непонятно. Надо делать все намного короче, понятнее и более простым языком. ## Метод В генерирующих моделях рекомендации процесс подготовки обучающих данных часто сводится к простому разбиению последовательных данных. Однако эта простая модель может недостаточно охватывать весь спектр возможных вариантов обучения. Мы предлагаем GenPAS — универсальный фреймворк, который моделирует подготовку данных как стохастический процесс сбора пар входных-целевых данных. Он делится на три этапа: **выбор последовательности**, **выбор цели**, **выбор входных данных**, и позволяет регулировать биазы в подготовке данных. Этот подход унифицирует многие существующие методы и позволяет быстрее экспериментировать с ними. ## Результаты Мы провели эксперименты на разных рекомендательных данных и проанализировали различные стратегии подготовки данных. Наши результаты показали, что предлагаемый GenPAS дает намного лучшую точность и эффективность использования данных по сравнению с другими методами. Также мы показали, что GenPAS дает лучший результат в задаче генерирования рекомендаций, особенно в подходах, которые до этого были недостаточно изучены. ## Значимость Предлагаемый подход может применяться в различных областях, где требуется рекомендация, например, в маркетинге, в социальных сетях и в технологиях личных рекомендаций. Он позволяет улучшить качество рекомендаций и снизить необходимое время обучения, что дает преимущество в реальном времени. Этот подход может стать базовым для дальнейшего исследования эффективности и систематизации подготовки данных в генерирующих рекомендательных моделях. ## Выводы Мы предложили GenPAS — универсальный фреймворк, который моделирует подготовку данных как стохастический процесс сбора пар входных-целевых данных. Этот подход дает лучшие результаты в генерировании рекомендаций и может быть использован в различных приложениях. Будущие исследования будут фокусироваться на улучшении применения GenPAS к реальным системам и его интеграции с другими методами подготовки данных.
Annotation:
Generative recommendation plays a crucial role in personalized systems, predicting users' future interactions from their historical behavior sequences. A critical yet underexplored factor in training these models is data augmentation, the process of constructing training data from user interaction histories. By shaping the training distribution, data augmentation directly and often substantially affects model generalization and performance. Nevertheless, in much of the existing work, this proces...
ID: 2509.13648v1 cs.LG, cs.IR
Авторы:

Jinmeiyang Wang, Jing Dong, Li Zhou

## Контекст Современные короткометражные видеоплатформы, такие как TikTok и YouTube Shorts, генерируют огромные объемы данных, которые требуют эффективных методов анализа поведения пользователей для оптимизации рекомендательных систем. Необходимость улучшить качество рекомендаций и увеличить удовлетворенность пользователей возникла вследствие параллельного роста пользовательских международных данных и доступности мобильных устройств. Однако существуют сложности, связанные с нестабильными приоритетами пользователей, конкуренцией внимания и нерегулярностью поведения. Эти факторы сильно сказываются на качестве рекомендаций и моделировании поведения. Данное исследование будет ориентировано на развитие модели, которая может лучше предсказывать поведение пользователей и оптимизировать рекомендации в короткометражных видеосредах. ## Метод Для решения вышеперечисленных проблем вновь предлагается модель MT-DQN (Multimodal Temporal Deep Q-Network), которая стандартизирована на трех основных элементах: Transformer, Temporal Graph Neural Network (TGNN) и Deep Q-Network (DQN). Эта модель использует конкатенацию входных моделей для обработки множественных модальных данных. Таким образом, модель может более точно прогнозировать поведение пользователей и принятие решений в реальном времени. Для обучения используется метод Deep Q-learning, который оптимизирует стратегии рекомендации. Также в модели включена графическая сеть, которая позволяет лучше анализировать зависимости между пользователями и видео, обеспечивая более точную оценку влияния внешних факторов. ## Результаты Результаты экспериментов проведены на крупном наборе данных, содержащих данные о поведении пользователей на короткометражных видеоплатформах. Модель MT-DQN была сравнена с двумя типичными моделями: Vanilla-DQN и Concat-Modal. Модель MT-DQN демонстрирует значительные улучшения по сравнению с Vanilla-DQN, снижая среднеквадратичную и абсолютную ошибки (MSE и MAE) на 34.8% и 26.5% соответственно. Также MT-DQN превосходит Concat-Modal на 10.97% по F1-метрике и 8.3% по NDCG@5. Эти результаты показывают, что MT-DQN эффективно комбинирует несколько моделей, что приводит к более точным и лучше оптимизированным рекомендациям. ## Значимость Модель MT-DQN может быть применена в разных областях, включая рекомендательные системы, анализ поведения пользователей и машинное обучение с дополнением. Она предоставляет более точные прогнозы поведения пользователей, что может повысить качество рекомендаций и увеличить удовлетворенность пользователей. Также модель может быть использована для оптимизации рекламных кампаний и улучшения интерфейсов пользователей. Таким образом, MT-DQN представляет собой значительный
Annotation:
This paper proposes the MT-DQN model, which integrates a Transformer, Temporal Graph Neural Network (TGNN), and Deep Q-Network (DQN) to address the challenges of predicting user behavior and optimizing recommendation strategies in short-video environments. Experiments demonstrated that MT-DQN consistently outperforms traditional concatenated models, such as Concat-Modal, achieving an average F1-score improvement of 10.97% and an average NDCG@5 improvement of 8.3%. Compared to the classic reinfor...
ID: 2509.12269v1 cs.LG, cs.IR
Показано 11 - 20 из 35 записей