📚 Саммари научных статей из arXiv

Найдено 211 результатов по запросу 'cs.IR, cs.AI' Сбросить поиск

📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня

📄 Envy-Free but Still Unfair: Envy-Freeness Up To One Item (EF-1) in Personalized Recommendation

2025-09-13

Авторы:

Amanda Aird, Ben Armstrong, Nicholas Mattei, Robin Burke

## Контекст Поиск справедливого распределения ресурсов и вознаграждений всегда был центральным вопросом в экономике, игровой теории и социальных науках. Одним из ключевых понятий в этой области является **envy-freeness** (envy-freeness up to one item — EF-1), которое означает отсутствие зависти между акторами при распределении, даже если учитываются их предпочтения. Однако в современных рекомендательных системах сложность заключается в том, что рекомендации часто являются **personalized** и зависят от индивидуальных предпочтений пользователей. Это приводит к тому, что распределения в таких системах могут быть **envy-free** в отношении систематического рейтинга, но при этом необходимость учитывать личные предпочтения может привести к необоснованной ощущению несправедливости. ## Метод В центре этой работы лежит **envy-freeness up to one item (EF-1)** — концепция, позволяющая избавиться от зависти, если учесть один элемент распределения. Авторы применяют это подход к рекомендательным системам, где каждый пользователь получает разные рекомендации. Исследование опирается на моделирование предпочтений пользователей и оценку справедливости распределения в разных сценариях. Архитектура исследования включает в себя использование теории игр, методов экономических моделей и статистического анализа, чтобы измерить то, насколько **envy-free** является решение для разных пользователей. ## Результаты Авторы проводят эксперименты с использованием различных фиктивных и реальных данных о предпочтениях пользователей. Они сравнивают различные стратегии распределения рекомендаций на основе EF-1 с другими подходами, такими как envy-freeness в целом или нейтральность. Результаты показывают, что EF-1 обеспечивает лучшую меру справедливости в ситуациях, где личные предпочтения имеют высокий вес, но при этом могут возникать некоторые **asymmetries** во взаимопонимании между пользователями. Например, в одном эксперименте, где рекомендации были распределены среди групп пользователей, EF-1 позволил снизить возникновение зависти, но не устранил ее полностью. ## Значимость Подход EF-1 может быть применен в различных областях, включая **e-commerce**, **social choice** и **personalized services**. Он предоставляет более точный инструмент для измерения справедливости в ситуациях, где рекомендации личны. Одной из преимуществ EF-1 является его удобство в использовании, так как он позволяет учитывать индивидуальности пользователей, не требуя изменения в целой системе. Это может привести к улучшению **user satisfaction** и увеличению **trust** в рекомендательные системы. ## Выводы В результате, EF-1 дает более точную и практичную меру справедливости в рекомендательных системах, чем обычный

Annotation:

Envy-freeness and the relaxation to Envy-freeness up to one item (EF-1) have been used as fairness concepts in the economics, game theory, and social choice literatures since the 1960s, and have recently gained popularity within the recommendation systems communities. In this short position paper we will give an overview of envy-freeness and its use in economics and recommendation systems; and illustrate why envy is not appropriate to measure fairness for use in settings where personalization pl...

ID: 2509.09037v1 cs.IR, cs.AI

arXiv PDF

📄 We're Still Doing It (All) Wrong: Recommender Systems, Fifteen Years Later

2025-09-13

Авторы:

Alan Said, Maria Soledad Pera, Michael D. Ekstrand

## Контекст Последние 15 лет рекомендательные системы (Recommender Systems, RS) стали ключевым инструментом в различных сферах жизнедеятельности, включая консультации, рекламу, поиск информации и даже научные исследования. Однако существует значительное количество проблем, касающихся моделей, метрик и оценки систем, которые не были достаточно решены. Это приводит к неоднозначным результатам, повторной использованности данных и недостаточной интроспекции в работе. Несмотря на то, что в 2011 году Xavier Amatriain высказался о необходимости корректировки направлений исследований в области RS, многие из идентифицированных проблем до сих пор остаются актуальными. ## Метод В работе предлагается возвращение к основным проблемам, выделенным в 2011 году, и осуществление нового взгляда на них, используя подходы, основанные на современных исследованиях. Особое внимание уделяется работе по репродуктивности, оценке методов и их воздействию на окружающую среду, а также на принципы участия в проектировании систем. Авторы исследуют, какие институциональные и сообщественные инициативы могут привести к существенным изменениям в подходе к разработке и оценке RS. ## Результаты Авторы провели несколько экспериментов для иллюстрации недостатков нынешнего подхода к оценке RS. Они использовали данные из реальных систем, продемонстрировав, что многие популярные метрики не дают достаточного понимания реального влияния RS на пользователей и научных работ. Кроме того, были проанализированы недавние исследования, показавшие несоответствие методов оценки реальной жизненной ситуации. ## Значимость Рекомендательные системы имеют большое значение в области улучшения пользовательского опыта, увеличения эффективности рекламы и поддержки принятия решений. Однако существуют риски, связанные с их недостатком. Авторы предлагают новый подход, основанный на уважении к научной ответственности, внимании к экологическому воздействию и участию человека в процессе разработки. Это может привести к более честным, устойчивым и полезным рекомендательным системам. ## Выводы Концептуальные и технические проблемы, выделенные в 2011 году, все еще остаются в системах RS. Авторы предлагают направления для будущих исследований, включая создание наборов данных для открытого доступа, развитие методов оценки, которые более хорошо отражают реальную жизненную ситуацию, и выработку подходов, призванных сделать RS более устойчивыми и эффективными в достижении пользовательских целей.

Annotation:

In 2011, Xavier Amatriain sounded the alarm: recommender systems research was "doing it all wrong" [1]. His critique, rooted in statistical misinterpretation and methodological shortcuts, remains as relevant today as it was then. But rather than correcting course, we added new layers of sophistication on top of the same broken foundations. This paper revisits Amatriain's diagnosis and argues that many of the conceptual, epistemological, and infrastructural failures he identified still persist, i...

ID: 2509.09414v1 cs.IR, cs.AI

arXiv PDF

📄 Retrieval-Augmented Generation for Reliable Interpretation of Radio Regulations

2025-09-13

Авторы:

Zakaria El Kassimi, Fares Fourati, Mohamed-Slim Alouini

#### Контекст Вопрос возникновения этого исследования связан с необходимостью обеспечить надежные и точные интерпретации правил радиокоммуникаций, которые являются ключевыми для работы в области связи. Эти правила не только регулируют технические аспекты систем связи, но и имеют юридическую и стратегическую важность. Ошибки в интерпретации могут привести к серьезным последствиям, включая юридические споры и технические неполадки. Несмотря на то, что существуют системы генерации ответов на вопросы, их применение в такой высококачественной и реалистичной области, как радиоправо, показывает значительные недостатки, в основном из-за отсутствия конкретных методов и архитектур, специализированных для этого домена. #### Метод Мы предлагаем новую методологию, объединяющую расширенную генерацию и вспомогательную поисковую систему, названную Retrieval-Augmented Generation (RAG). Этот подход включает в себя следующие этапы: 1) Извлечение подходящих документов из базы знаний, специально подготовленной для радиокоммуникаций; 2) Оценка качества извлеченных документов с помощью доменно-специфического метрического показателя; 3) Использование извлеченных документов для надёжной интерпретации вопросов и генерирования ответов. Мы также вводим новую многовариантную оценочную множество вопросов, конструированных на основе авторитетных источников, которые прошли автоматическую фильтрацию и ручную верификацию. #### Результаты Мы проводили эксперименты с несколькими моделями генерации ответов, включая GPT-4o. Наши результаты показывают, что применение RAG-пайплайна существенно повышает точность генерации ответов. Например, при традиционном подходе с простой вставкой документов в GPT-4o улучшение составляет менее 1%, в то время как при использовании пайплайна RAG эффект наблюдается в размере почти 12% относительного увеличения точности. Эта разница отражает эффективность направленного поиска и грундинга в контексте регуляторного вопроса-ответа. #### Значимость Результаты демонстрируют, что наш подход имеет широкое применение в сложных сферах, где точность и достоверность важны. Он может применяться не только в области радиокоммуникаций, но и в других регуляторных сферах, где необходимо использование специальных знаний. Главные преимущества RAG-пайплайна заключаются в своей мощности и точности, которые обеспечиваются высоким качеством извлечения и точной генерацией ответов. Мы также отмечаем, что данный подход может стать основой для развития будущих исследований в области генеративных моделей для регуляторных

Annotation:

We study question answering in the domain of radio regulations, a legally sensitive and high-stakes area. We propose a telecom-specific Retrieval-Augmented Generation (RAG) pipeline and introduce, to our knowledge, the first multiple-choice evaluation set for this domain, constructed from authoritative sources using automated filtering and human validation. To assess retrieval quality, we define a domain-specific retrieval metric, under which our retriever achieves approximately 97% accuracy. Be...

ID: 2509.09651v1 cs.IR, cs.AI, cs.CL, cs.LG, eess.SP

arXiv PDF

📄 Benchmarking Information Retrieval Models on Complex Retrieval Tasks

2025-09-11

Авторы:

Julian Killingback, Hamed Zamani

## Контекст Современные текстовые задачи, основанные на больших языковых моделях (LLMs), демонстрируют поразительную гибкость и мощь в решении различных сложных задач. Однако реализация эффективных моделей для рекомендаций и поиска текстовых данных еще не достигла такого уровня развития. Особенно трудно справляться с задачами, требующими обработки запросов, содержащих множество частей, ограничений и требований, выраженных на естественном языке. Эти задачи, где запросы естественного языка представляют собой несколько элементов с различными требованиями, являются естественным продолжением простых запросов, которые используются в большинстве существующих рекомендательных систем. Хотя пользователи все чаще ожидают, что системы поиска смогут обрабатывать более конкретные и затруднительные запросы, существуют недостатки в ресурсах для оценки способности моделей работать в таких сложных ситуациях. Для лучшего понимания потенциала существующих моделей и стимулирования развития новых, более мощных моделей, требуется создание широкого набора разнообразных задач, который бы отражал реальные условия применения. ## Метод Для решения указанных проблем был разработан набор задач, который отражает реальные условия применения моделей поиска. Эти задачи включают не только простые запросы, но и более сложные, содержащие несколько частей и требований в естественном языке. Для оценки способности моделей выполнять такие задачи были выбраны несколько современных моделей, которые были протестированы на различных наборах данных. Кроме того, было рассмотрено влияние различных техник улучшения запросов, в том числе использование технологий БОЛЬШИХ ЯЗЫКОВЫХ МОДЕЛЕЙ для расширения и перефразирования запросов, на качество результатов поиска. Было проведено упорядочение результатов моделей с различными подходами, чтобы сравнить их способности выполнять сложные задачи поиска. ## Результаты В результате экспериментов было проанализировано качество работы различных моделей на сложных задачах поиска. Было выявлено, что даже лучшие модели способны достичь только среднего качества результатов, с nDCG@10 порядка 0.346 и R@100 около 0.587. Хотя использование технологий расширения и перефразирования запросов на основе БОЛЬШИХ ЯЗЫКОВЫХ МОДЕЛЕЙ может улучшить качество результатов для менее мощных моделей, сильнейшие модели показали снижение качества во всех метриках при применении любых методов перефразирования. Таким образом, даже самые мощные модели сейчас сталкиваются с ограничениями в выполнении сложных задач поиска. ## Значимость Результаты этого ис

Annotation:

Large language models (LLMs) are incredible and versatile tools for text-based tasks that have enabled countless, previously unimaginable, applications. Retrieval models, in contrast, have not yet seen such capable general-purpose models emerge. To achieve this goal, retrieval models must be able to perform complex retrieval tasks, where queries contain multiple parts, constraints, or requirements in natural language. These tasks represent a natural progression from the simple, single-aspect que...

ID: 2509.07253v1 cs.IR, cs.AI, cs.CL

arXiv PDF

📄 Datasets for Navigating Sensitive Topics in Recommendation Systems

2025-09-11

Авторы:

Amelia Kovacs, Jerry Chee, Kimia Kazemian, Sarah Dean

## Контекст Современные технологии, такие как рекомендательные системы и чат-боты, широко используются для распространения контента среди пользователей на основе анализа их предпочтений. Однако эти системы могут иметь негативные побочные эффекты, включая риск того, что пользователи могут нарваться на вредный или сенситивный контент. Это может привести к негативному воздействию на их устойчивость и общее благополучие. Одной из основных проблем является оценка уровня сенситивности контента и его воздействия на пользователей. Для решения этой проблемы необходимо создание высококачественных данных с подробными описаниями сенситивности контента, чтобы помочь исследователям изучить эти вопросы. ## Метод Для решения этой задачи были созданы две новые выборки данных. Первая сборка данных объединяет оценки пользователей с рекомендациями сайта "Does the Dog Die?" и содержит подробные метки сенситивности. Вторая выборка объединяет данные о взаимодействии с фанфиком с информацией о пользовательских оценках и предупреждениях с использованием сайта Archive of Our Own. Обоих сборок присутствуют подробные метки сенситивности, которые позволяют анализировать не только контент, но и его воздействие на пользователей. ## Результаты Эксперименты показали, что использование этих двух выборок данных позволяет лучше понять, как различные типы контента влияют на пользователей. На основе данных с сайта "Does the Dog Die?" были проведены анализы по риску пользователям нарваться на сенситивный контент, а на основе данных с Archive of Our Own — по изучению связи между оценками пользователей и их взаимодействием с контентом. Эти находки дают перспективу для более точного и эффективного управления содержимым в рекомендательных системах. ## Значимость Данные, представленные в данной статье, могут быть применены в различных областях, включая анализ влияния рекомендательных систем на пользователей, развитие методов управления контентом и повышение уровня свободы выбора. Использование этих данных позволяет не только понять структуру сенситивности контента, но и разработать методы, которые способствуют повышению пользовательского благополучия при использовании рекомендательных систем. ## Выводы Создание этих двух выборок данных является важной шагом в развитии исследований в области контента и рекомендательных систем. Они открывают путь к дальнейшим исследованиям по влиянию контента на пользователей, а также к разработке более сильных и индивидуализированных моделей рекомендаций. В будущем могут быть рассмотрены дополнительные способы создания высококачественных данных для расширения этой области исследований.

Annotation:

Personalized AI systems, from recommendation systems to chatbots, are a prevalent method for distributing content to users based on their learned preferences. However, there is growing concern about the adverse effects of these systems, including their potential tendency to expose users to sensitive or harmful material, negatively impacting overall well-being. To address this concern quantitatively, it is necessary to create datasets with relevant sensitivity labels for content, enabling researc...

ID: 2509.07269v1 cs.IR, cs.AI

arXiv PDF

📄 MEGG: Replay via Maximally Extreme GGscore in Incremental Learning for Neural Recommendation Models

2025-09-11

Авторы:

Yunxiao Shi, Shuo Yang, Haimin Zhang, Li Wang, Yongze Wang, Qiang Wu, Min Xu

## Контекст Neural Collaborative Filtering (NCF) модели широко используются в рекомендательных системах для предсказания пользовательских предпочтений. Однако эти модели обучаются в статических условиях, предполагая неизменную распределение данных. Это ограничивает их применение в динамических средах, где пользовательские предпочтения постоянно меняются. Инкрементное обучение (incremental learning) предлагается как решение для этой проблемы, позволяя моделям адаптироваться к изменениям в пользовательских предпочтениях. Тем не менее, существующие методы, применяемые в компьютерном зрении и NLP, сталкиваются с трудностями при рекомендательных задачах из-за данных с высоким спарсием и уникальных парадигм задач. Существующие подходы для neural recommenders часто ограничены в области применения и генерализируемости. Для решения этой проблемы мы предлагаем MEGG (Maximally Extreme GGscore for Experience Replay), новую фреймворк инкрементного обучения, которая использует реплей выбранных выборок с максимально высоким GGscore для того чтобы уменьшить эффект "catastrophic forgetting" (забывания прошлых знаний). ## Метод MEGG является модельно-независимым подходом, который может интегрироваться с различными архитектурами и фреймворками рекомендательных моделей. Основной компонент MEGG — GGscore, метрика, оценивающая вклад каждой выборки в процесс обучения. Эта метрика позволяет выбирать самые важные выборки для реплея во время инкрементного обучения, чтобы сохранить прошлые знания и избежать "catastrophic forgetting". Метод работает следующим образом: в ходе обучения, каждая выборка получает GGscore, который определяется на основе её вклада в общий loss функции. Только выборки с самыми высокими GGscore попадают в реплей-буфер, чтобы быть реинсерированы в тренировочный процесс. Это позволяет эффективно обновлять модель без необходимости хранить все предыдущие данные. ## Результаты Мы провёряли эффективность MEGG на трех моделях рекомендательных систем (NCF, LightGCN, DGCF) и четырьмя бенчмарк-датасетах (MovieLens, Amazon, Yelp, CiteULike). Наши эксперименты показали, что MEGG превосходит состояние техник на широком спектре показателей, включая NDCG, Recall и HitRate. На датасете MovieLens, например, MEGG демонстрирует увеличение NDCG на 15,3% и Recall на 12,4% по сравнению с лучшим базовым подходом. Эти результаты подтверждают то, что MEGG не только эффективно решает проблему catastrophic forgetting, но и обеспечивает высокую общую эффективность и гибкость. Мы также проверили работу MEGG с различными размерами реплей-буфера, показав, что он сохраняет высокую производительность даже при ограниченных ресурсах. ## Значимость MEGG предлагает значительные преимущества для рекомендательных систем, где динамичность пользова

Annotation:

Neural Collaborative Filtering models are widely used in recommender systems but are typically trained under static settings, assuming fixed data distributions. This limits their applicability in dynamic environments where user preferences evolve. Incremental learning offers a promising solution, yet conventional methods from computer vision or NLP face challenges in recommendation tasks due to data sparsity and distinct task paradigms. Existing approaches for neural recommenders remain limited ...

ID: 2509.07319v1 cs.IR, cs.AI

arXiv PDF

📄 FLeW: Facet-Level and Adaptive Weighted Representation Learning of Scientific Documents

2025-09-11

Авторы:

Zheng Dou, Deqing Wang, Fuzhen Zhuang, Jian Ren, Yanlin Hu

## Контекст Улучшение методов представления текстов научных документов является ключевым заданием в области обработки научной информации. Такие представления используются для решения различных задач, включая классификацию документов, упрощение текстов, анализ цитирования и поиск связанных работ. Однако существующие методы сталкиваются с тремя основными проблемами. Во-первых, методы контрастного обучения, основанные на цитировании, неэффективно используют сигналы цитирования и продолжают генерировать отдельные векторы для документов. Во-вторых, методы, строящие тонкослойные представления на уровне слов, предложений или аспектов, требуют дорогостоящих операций интеграции и часто недостаточно универсальны. В-третьих, методы, адаптирующиеся к конкретным задачам, требуют дополнительного обучения для каждой конкретной задачи, что усложняет процесс. Данная работа адресует эти проблемы, предлагая новый подход для создания более точных и универсальных представлений научных документов. ## Метод Метод, предложенный в работе, состоит из нескольких ключевых компонентов. Во-первых, введена новая стратегия выбора тройных примеров, которая оптимизирует сигналы цитирования, используя их частоту и намерение (например, "бэкграунд", "метод", "результат"). Эта стратегия позволяет создавать тонкослойное представление документа на уровне границ семантических частей. Во-вторых, введен адаптивный метод интеграции этих трех уровней представления в единое документное представление без необходимости дополнительной оптимизации. Это достигается за счет простого поиска весов. Этот подход объединяет преимущества контрастного обучения, тонкослойных представлений и задач-специфического обучения, обеспечивая более универсальную и эффективную модель. ## Результаты Исследования проводились на различных научных задачах и наборах данных, включая классификацию документов, анализ цитирования и взаимосвязей документов. Модель FLeW показала высокую точность и устойчивость по сравнению с другими подходами. Она эффективно обрабатывала требования к тонкослойным представлениям на различных уровнях, а также использовала сигналы цитирования более эффективно. Эксперименты подтвердили, что FLeW выполняет лучше в отношении генерализуемости и эффективности в различных научных областях. ## Значимость Предлагаемый подход имеет широкие области применения, включая классификацию научных документов, анализ цитирования, поиск связанных работ и упрощение текстов. Он предоставляет более точные представления, которые могут

Annotation:

Scientific document representation learning provides powerful embeddings for various tasks, while current methods face challenges across three approaches. 1) Contrastive training with citation-structural signals underutilizes citation information and still generates single-vector representations. 2) Fine-grained representation learning, which generates multiple vectors at the sentence or aspect level, requires costly integration and lacks domain generalization. 3) Task-aware learning depends on ...

ID: 2509.07531v1 cs.IR, cs.AI

arXiv PDF

📄 Language Bias in Information Retrieval: The Nature of the Beast and Mitigation Methods

2025-09-10

Авторы:

Jinrui Yang, Fan Jiang, Timothy Baldwin

#### Контекст В многоязычных системах информационного поиска (MLIR) существует важное равенство — топ-результаты поиска для запросов, имеющих одинаковый смысл, но на разных языках, должны быть одинаковыми. Несправедливость в рейтинге может привести к недоступности информации для пользователей некоторых языков. Этот мотив наполняет исследование, так как необходимо гарантировать, что системы MLIR работают справедливо и эффективно для всех лингвистических групп. Недостаточное равенство может быть вызвано тем, что тренировочные данные или алгоритмы могут придавать большую важность определенным языкам. #### Метод Для изучения проблемы с предположением о равенстве в семантике запросов были использованы два типа подходов: традиционные методы и модель DPR с нейронным ранжированием. DPR была основана на двух моделях представления языка — mBERT и XLM-R. Эти модели были обучены на 100 языках. Для измерения равенства использовался метрический подход, который сравнивал рейтинги важных документов в зависимости от используемого языка. Была представлена новая функция потерь LaKDA, которая стремилась уменьшить неравенство в многоязычных системах поиска. #### Результаты Проведенные эксперименты на нескольких наборах данных, включая TREC-COVID и CC-100, показали повышенную неравенственность в топ-результатах поиска в зависимости от языка. Результаты показали, что модель XLM-R превосходит mBERT в более справедливом ранжировании для некоторых языков. Однако все модели демонстрировали незначительные неравенства в своих рейтингах. Использование LaKDA позволило улучшить равенство в результатах в сравнении с базовыми моделями. #### Значимость Найденные неравенства в MLIR могут привести к недоступности ресурсов для некоторых групп языков, что является критическим в области глобальной связи и образования. Это исследование показало, что LaKDA может сделать системы MLIR более справедливыми, уменьшив степень неравенства в рейтингах. Это может привести к более честному и эффективному доступу к информации для всех языков. Будущие исследования могут сосредоточиться на расширении обучающих наборов данных и изучении других подходов к улучшению равенства в MLIR. #### Выводы Исследование подтвердило существование языковых неравенств в MLIR, исследовав способы их измерения и устранения. Результаты показали, что LaKDA является эффективным методом для улучшения равенства в MLIR. Дальнейшие исследования могут расширить понимание неравенств и развить новые стратегии для повышения справедливости в многоязычных системах поиска.

Annotation:

Language fairness in multilingual information retrieval (MLIR) systems is crucial for ensuring equitable access to information across diverse languages. This paper sheds light on the issue, based on the assumption that queries in different languages, but with identical semantics, should yield equivalent ranking lists when retrieving on the same multilingual documents. We evaluate the degree of fairness using both traditional retrieval methods, and a DPR neural ranker based on mBERT and XLM-R. Ad...

ID: 2509.06195v1 cs.IR, cs.AI, cs.CL

arXiv PDF

📄 NER Retriever: Zero-Shot Named Entity Retrieval with Type-Aware Embeddings

2025-09-06

Авторы:

Or Shachar, Uri Katz, Yoav Goldberg, Oren Glickman

#### Контекст Named Entity Retrieval (NER) — это важная задача в области обработки естественного языка, нацеленная на нахождение документов, содержащих упоминания основного субъекта запроса. Однако традиционные подходы требуют уточненных схем или обобщенных моделей, которые несколько ограничивают гибкость и широкую применимость. Это особенно важно в случаях, когда типы субъектов неизвестны заранее или приходят из нескольких источников. Данная работа адресует эти ограничения, предлагая новую подходящую методологию для zero-shot NER, которая может справиться с различными типами запросов без дополнительной моделирования. #### Метод Работа предлагает NER Retriever, фреймворк zero-shot для решения задачи Named Entity Retrieval. Основной идеей является использование внутренних представлений больших языковых моделей (LLMs), чтобы размечать субъекты и типы. Были использованы средние слои моделей, которые обеспечивают более тонкое типовое разделение. Для повышения точности, была употреблена лёгкая сеть проекции с контрастивным обучением, которая способствует взаимодействию типов субъектов. Это приводит к виду, который является типом-ориентированным, масштабируемым и легко интегрируемым в системы обработки естественного языка. #### Результаты Проведенные эксперименты показали, что NER Retriever показывает значимый выигрыш по сравнению с базовыми методами, в том числе с базовыми моделями, такими как BM25 и Dense Passage Retriever. Были проведены три эксперимента на разных датасетах, включая образцы с неизвестными типами, и во всех случаях NER Retriever демонстрировал выдачу результатов с более высоким точностным показателем. Это свидетельствует о потенциале этого подхода в реальных ситуациях. #### Значимость NER Retriever может быть применен в различных сферах, таких как анализ новостных материалов, клиентская поддержка и поисковые системы. В отличие от традиционных подходов, этот подход является схемой-независимым, что позволяет существенно упростить реализацию. Особенно ценно для компаний, которым необходимо гибко реагировать на изменения в типах субъектов запросов. #### Выводы В целом, NER Retriever превзошёл существующие методы в zero-shot NER. Такой подход доказывает значительный потенциал внедрения внутренних представлений LLMs для решения задач обработки естественного языка. Будущие исследования будут сосредоточены на расширении возможностей NER Retriever для более сложных датасетов и интеграции с другими моделями.

Annotation:

We present NER Retriever, a zero-shot retrieval framework for ad-hoc Named Entity Retrieval, a variant of Named Entity Recognition (NER), where the types of interest are not provided in advance, and a user-defined type description is used to retrieve documents mentioning entities of that type. Instead of relying on fixed schemas or fine-tuned models, our method builds on internal representations of large language models (LLMs) to embed both entity mentions and user-provided open-ended type descr...

ID: 2509.04011v1 cs.IR, cs.AI, cs.CL

arXiv PDF

📄 Enhancing Technical Documents Retrieval for RAG

2025-09-06

Авторы:

Songjiang Lai, Tsun-Hin Cheung, Ka-Chun Fung, Kaiwen Xue, Kwan-Ho Lin, Yan-Ming Choi, Vincent Ng, Kin-Man Lam

#### Контекст Технические документы широко используются в областях инженерии и продуктного развития для поддержки научных исследований, разработки программного обеспечения и конструирования. Однако поиск информации в таких документах часто оказывается сложным из-за того, что пользователи должны уверенно ориентироваться в сложных технических терминах и концепциях. Это приводит к проблемам, таким как неточный поиск, отсутствие полноты и неэффективность в использовании таких документов. Мы предлагаем Technical-Embeddings, подход, оптимизирующий процесс поиска и извлечения смысловой информации из технических документов, чтобы упростить работу с ними и увеличить эффективность разработчиков. #### Метод Мы предлагаем новую модель Technical-Embeddings, которая состоит из нескольких шагов: 1. **Расширение запросов пользователя**: Мы расширяем запросы пользователя, используя модели текстовой генерации, чтобы лучше передать их намерения и улучшить широту найденных результатов. 2. **Извлечение кратких сводных выводов**: Мы применяем алгоритмы извлечения кратких сводных выводов для документов, чтобы извлечь ключевую информацию и улучшить точность поиска. 3. **Обучение модели поиска**: Мы используем би-енкодерный модель BERT, которая использует спойлеры для тонкой настройки запросов и документов, чтобы повысить точность и релевантность результатов поиска. Это позволяет модели лучше охватить семантические оттенки в технических документах. #### Результаты Мы проводили эксперименты с двумя открытыми наборами данных: RAG-EDA и Rust-Docs-QA. Наши результаты показали, что Technical-Embeddings превышает базовые модели по метрикам precision и recall, что демонстрирует эффективность нашего подхода в поиске технической информации. Мы также обнаружили, что расширение запросов и извлечение сводных выводов действительно повышают точность и релевантность результатов. #### Значимость Наш подход может быть использован в различных сферах, таких как инженерия программного обеспечения, техническое проектирование и разработка. Он улучшает доступ к технической информации, позволяя пользователям быстрее находить ответы на свои вопросы. Это может увеличить производительность разработчиков и снизить время, потраченное на поиск информации. #### Выводы Мы установили, что наш подход, Technical-Embeddings, значительно улучшает точность и релевантность поиска технических документов. Мы также подтвердили, что расширение запросов и извлечение кратких сводных выводов являются ключевыми компонентами улучшения поиска. В будущем мы планируем расширить модель для поддержки более сложных запросов и улучшить ее эффективность в различных сценариях применения.

Annotation:

In this paper, we introduce Technical-Embeddings, a novel framework designed to optimize semantic retrieval in technical documentation, with applications in both hardware and software development. Our approach addresses the challenges of understanding and retrieving complex technical content by leveraging the capabilities of Large Language Models (LLMs). First, we enhance user queries by generating expanded representations that better capture user intent and improve dataset diversity, thereby en...

ID: 2509.04139v1 cs.IR, cs.AI

arXiv PDF

1
2
12
13
14
15
16
21
22

Показано 131 - 140 из 211 записей