📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 0

Последнее обновление: сегодня
Авторы:

Yannick Kalff, Katharina Simbeck

## Контекст В последние годы AI-based recommender systems становятся все более важной частью процессов принятия решений в HRM, особенно в сфере рекрутинга. Эти системы помогают оптимизировать поиск кандидатов, но при этом становятся все более сложными и непрозрачными для пользователей. Транспарентность и ответственное применение AI в HRM являются ключевыми аспектами, чтобы избежать потенциальных ошибок и сбиться с пути эффективности. Эта исследовательская работа основывается на необходимости изучить, как знание HR-менеджеров о AI (AI Literacy) влияет на их восприятие и понимание AI-based recommender systems, а также как это влияние может повлиять на качество их решений. ## Метод Для изучения этого вопроса был проведен онлайн-эксперимент с 410 HR-менеджерами из Германии. Участники сравнили базовые дашборды с версиями, дополненными тремя стилями XAI (eXplainable AI): важные признаки (important features), контрфактолы (counterfactuals) и критерии модели (model criteria). Задача эксперимента заключалась в оценке того, насколько эти различные стили XAI влияют на степень понимания и оценку пользователей. Опыт позволил изучить, как различные знания о AI влияют на степень помощи, доверия и точности понимания рекомендательных систем. ## Результаты Исследование показало, что дашборды, используемые в практических решениях, часто не обеспечивают полного понимания AI-решений и даже делают AI-элементы более затруднительными для понимания. Хотя добавление XAI-элементов улучшило субъективные ощущения пользователей в отношении полезности и доверия, оно не увеличило их объективное понимание рекомендательных систем. Более того, сложные XAI-элементы могут даже ухудшить точность понимания, особенно у тех, кто имеет низкий уровень AI Literacy. Однако те, кто имеет высокий уровень знаний о AI, получили помощь от визуальных оверлеев важных признаков, что улучшило их точное понимание рекомендательных систем. ## Значимость Результаты этого исследования имеют большое значение для разных областей. В первую очередь, они подтверждают, что благодаря XAI-элементам улучшается субъективное восприятие пользователями, особенно тех, кто имеет уже некоторое знание AI. Однако, необходимо создавать более направленные стратегии объяснения, чтобы обеспечить лучшую ценность XAI в HRM. Также, эти результаты подчеркивают необходимость создания как минимум поверхностных знаний AI для HR-менеджеров, чтобы улучшить эффективность использования AI-based recommender systems и обеспечить честную, прозрачную и эффективную реализацию AI в HRM. ## Выводы Основной вывод данного исследования заключается в том, что знание о AI-технологиях имеет необходимость
Annotation:
AI-based recommender systems increasingly influence recruitment decisions. Thus, transparency and responsible adoption in Human Resource Management (HRM) are critical. This study examines how HR managers' AI literacy influences their subjective perception and objective understanding of explainable AI (XAI) elements in recruiting recommender dashboards. In an online experiment, 410 German-based HR managers compared baseline dashboards to versions enriched with three XAI styles: important features...
ID: 2509.06475v1 cs.HC, cs.AI, cs.CY, A.0; H.5.2; I.2; J.1; K.4.2; K.4.3
Авторы:

Joseph Jackson, Georgiy Lapin, Jeremy E. Thompson

## Контекст Область исследования, связанная с социальными сетями, привлекает внимание из-за роли этих платформ в распространении информации и влиянии на общественное мнение. Одной из причин, по которой социальные сети порой генерируют вирусную информацию, является потенциал эффекта "газовых бутылок", когда пользователи образуют свои собственные мнения и экосистемы, при этом производят контент, который в последствии отражается внутри этих "газовых бутылок". Наиболее известная модель, представляющая собой аналог этих эффектов, является "гравитационный колодец" (gravity well), которая рассматривает эхо-частуши точно как гравитационные системы. Несмотря на эффективность этой модели, в ней отсутствует учет фактора подтверждающего биаса (confirmation bias), т.е., тенденции пользователя подтверждать свои существующие убеждения. ## Метод Мы дополняем модель гравитационного колодца, внедряя в нее динамическую переменную, отражающую уровень подтверждающего биаса каждого пользователя. Для каждого пользователя такая переменная вычисляется на основе сравнения его взаимодействия с содержанием различных точек зрения. Этот подход позволяет нам расширить существующую модель, реализовав в ней подтверждающий биаз, чтобы лучше понять динамику эхо-частуши. Мы внедрили этот подход в алгоритмы обнаружения эхо-частуш разными техническими методами, включая интеллектуальную обработку текста и анализ отношений между пользователями. ## Результаты Мы проверили эту модель на девянадцати сообществах Reddit, включая сообщества разных специализаций, включая технологии, политику и другие. Модель показала значительную улучшенную точность в обнаружении эхо-частуш в сравнении с традиционной моделью гравитационного колодца. Мы также смогли выделить, как динамическая переменная, отражающая подтверждающий биаз, влияет на динамику сообществ. Это дало нам мощный инструмент для определения здоровости коммьюнити и риска распространения мифифактов. ## Значимость Модель может быть применена в различных областях, включая мониторинг социальных сетей, оценку динамики сообществ и поиск сигналов, связанных с распространением мифифактов. Это предоставляет возможность лучше понять, как пользователи взаимодействуют в эхо-частушах, и обеспечивает новые возможности для управления этими динамиками. Одним из ключевых преимуществ является возможность отслеживания сообществ на стадии ранней динамики, что позволяет предотвратить распространение мифифактов на ранних этапах их развития. ## Выводы Мы представили расширенную модель гравитаци
Annotation:
Social media echo chambers play a central role in the spread of misinformation, yet existing models often overlook the influence of individual confirmation bias. An existing model of echo chambers is the "gravity well" model, which creates an analog between echo chambers and spatial gravity wells. We extend this established model by introducing a dynamic confirmation bias variable that adjusts the strength of pull based on a user's susceptibility to belief-reinforcing content. This variable is c...
ID: 2509.03832v2 cs.SI, cs.AI, cs.CY
Авторы:

Ryosuke Takata, Atsushi Masumori, Takashi Ikegami

################################# ## Контекст ################################# В области искусственного интеллекта (ИИ) исследования сфокусированы на поведении коллективных систем, включая имитацию человеческих стратегий решения проблем. Одним из ключевых объектов исследований является традиционный El Farol Bar problem, который представляет собой классическую структуру социального дилемма. В этой ситуации игроки должны решать, стоит ли им посетить бар в определенный день, чтобы избежать переутомления от переполненного зала. Хотя ранее для решения этой задачи использовались модели гейм-теории, они не учитывали поведенческие и социальные мотивы, которые характерны для реальных людей. Ла LLM agents (Large Language Models) предлагают новый подход, включающий в себя сложную нейронную сеть, обученную на текстовых данных. Этот подход может оказаться полезным для моделирования социальных динамик, как это демонстрируется в данном исследовании. ################################# ## Метод ################################# Исследование построено на использовании LLM agents, которые автоматически определяют стратегии посещения бара, исходя из предложенных ими внешних и внутренних мотивов. Эти модели обучены на тексте, что позволяет имитировать человеческие мотивы, такие как доверие, социальные предпочтения и мнение о ситуации. Для моделирования поведения использовалась специальная архитектура сети, которая основывается на многослойном персептроне (MLP) с возможностью социального взаимодействия. Поведение агентов было протестировано в условиях специально разработанного эксперимента, в котором игроки должны были принимать решения в рамках предопределенных ограничений, таких как посещаемость бара до 60% от максимального. ################################# ## Результаты ################################# Лингвистические модели демонстрировали закономерности в поведении, которые отличались от теоретических ожиданий. Например, они не только выбирали решения, оптимизируя личный выигрыш, но и сталкивались с внутренним дилеммой: стремиться к коллективному решению или следовать индивидуальным мотивам. В результате, LLM agents показали человеческий характер решений, где ключевым мотивом является не только экономическая выгода, но и социальная связь. Эксперименты показали, что модели не отказываются от логического мышления, но при этом могут принимать решения, которые не являются оптимальными в традиционной гаме-теории. ################################# ## Значимость ################################# Результаты имеют большое значение для практических приложений в области виртуальных экономий, искусственного интеллекта и систем управления. В частности, модели могут быть применены к моделированию групповых решений, таких как экологическое управление, рыночные стратегии и социальные сети. Эти модели также открывают новые горизонты в изучени
Annotation:
We investigate the emergent social dynamics of Large Language Model (LLM) agents in a spatially extended El Farol Bar problem, observing how they autonomously navigate this classic social dilemma. As a result, the LLM agents generated a spontaneous motivation to go to the bar and changed their decision making by becoming a collective. We also observed that the LLM agents did not solve the problem completely, but rather behaved more like humans. These findings reveal a complex interplay between e...
ID: 2509.04537v2 cs.MA, cs.AI, cs.CY
Авторы:

Sidahmed Benabderrahmane, Talal Rahwan

## Контекст Advanced Persistent Threats (APTs) являются одной из наиболее опасных угроз в сфере кибербезопасности. Они характеризуются своим незаметным и продолжительным характером, что делает их сложнее обнаружить. Традиционные супервизированные методы обучения требуют больших объемов меток данных, что часто отсутствует в реальных условиях. Такая нехватка данных с метками препятствует эффективному обучению моделей и снижению затрат на ручную маркировку. Это ставит перед исследователями задачу создания методов, которые бы эффективно обучались с минимальным количеством меток. Наша работа призвана решить эту проблему, объединяя технологии автокодирования и активного обучения для улучшения обнаружения APT. ## Метод Мы предлагаем архитектуру Attention Adversarial Dual AutoEncoder (AAD-AE) для аномалийного обнаружения, которая использует активное обучение для постоянного улучшения модели. Автокодировщик с аттенцией обнаруживает аномалии, а активное обучение создает запросы по меткам только для неоднозначных примеров. Это позволяет сократить затраты на метки, не ухудшая качество обучения. Мы также вводим технику адверсарского аугментации, которая генерирует поддельные примеры, чтобы лучше обучить модель к различным сценариям атак. Модель обучается по нескольким системным данным (Linux, Android, BSD, Windows), что позволяет обрабатывать разнообразные APT-атаки. ## Результаты Метод был проверен на реальных данных DARPA Transparent Computing program, где APT-атаки составляют всего 0.004% от общего объема данных. Мы проводили эксперименты в двух сценариях атак и сравнивали результаты с тремя современными аналогами. Активное обучение показало значительные улучшения в обнаружении APT по сравнению с другими методами. Мы также показали, что адверсарская аугментация существенно повышает точность обнаружения, даже при нехватке данных. ## Значимость Наш подход может быть применен в различных ситуациях, где данные меток ограниченны, но необходимо обнаруживать редкие и сложные аномалии. Он эффективен для различных системных платформ и может быть использован для расширения существующих методов кибербезопасности. Это включает в себя наблюдение за системным поведением, обнаружение вредоносной активности малого размера и повышение уровня общей кибербезопасности. ## Выводы Мы доказали, что наш подход не только эффективно улучшает обнаружение APT, но и экономит ресурсы на ручной маркировке данных. Будущие исследования будут сконцентрированы на расширении модели на другие виды аномального поведения и улучшении ее точности на более больших данных.
Annotation:
Advanced Persistent Threats (APTs) present a considerable challenge to cybersecurity due to their stealthy, long-duration nature. Traditional supervised learning methods typically require large amounts of labeled data, which is often scarce in real-world scenarios. This paper introduces a novel approach that combines AutoEncoders for anomaly detection with active learning to iteratively enhance APT detection. By selectively querying an oracle for labels on uncertain or ambiguous samples, our met...
ID: 2509.04999v1 cs.CR, cs.AI, cs.CY, cs.LG
Авторы:

Joseph Jackson, Georgiy Lapin, Jeremy E. Thompson

## Контекст Область исследования социальных сетей и отдельно взятых эхо-камер (эхо-коммьюнити) широко изучается в соответствии с ростом влияния этих феноменов на распространение мифов и дезинформации в современном мире. Одним из существенных факторов, влияющих на распространение мифов, является **конфирмационный биас**, который отражается в поиске, интерпретации и воспроизведении информации, поддерживающей уже существующие взгляды пользователя. Однако существующие модели эхо-камер, такие как "гравитационный яма" (gravity well), редко учитывают этот фактор. Мотивация для исследования заключается в развитии более точной модели, которая учитывает конфирмационный биас и позволяет более эффективно определять и анализировать эхо-камеры в социальных сетях. ## Метод Модель **Confirmation Bias Gravity Well (CBGW)** является расширением традиционного "гравитационного яма" (gravity well) модели. Основное добавление - **динамическая конфирмационная мотивация (dynamic confirmation bias variable)**, которая вычисляется для каждого пользователя на основе сравнения его постов и ответов к другим постам с разными точками зрения. Этот показатель определяет степень восприимчивости пользователя к конфирмационному биасу. Модель также включает в себя алгоритмы, которые используют данные пользователей для структурирования эхо-камер в гравитационных ямах и определения степени влияния конфирмационного биаса на них. ## Результаты В ходе экспериментов было исследовано 19 Reddit-сообществ. Результаты показали, что модель CBGW выдает более точные оценки воздействия конфирмационного биаса на эхо-камеры. Она позволяет выделять **критерии социальной здоровья сообществ**, такие как разнообразие мнений и уровень дискуссий. Эти критерии позволяют выявлять наиболее опасные конфирмационные ямы, которые могут привести к распространению мифов и дезинформации. ## Значимость Модель CBGW может быть применена в различных областях, включая мониторинг распространения мифов, оценку здоровья социальных сетевых сообществ и разработку стратегий для борьбы с дезинформацией. Основное преимущество заключается в том, что модель учитывает конфирмационный биас, что позволяет более точно понимать и анализировать динамику эхо-камер. Это может привести к более эффективным мерам по борьбе с распространением мифов и укреплению общественного осведомленности. ## Выводы Наша модель CBGW является значительным шагом в понимании влияния конфирмационного биаса на эхо-камеры в социальных сетях. Результаты экспериментов показали, что модель может быть применена для более точной оценки и выя
Annotation:
Social media echo chambers play a central role in the spread of misinformation, yet existing models often overlook the influence of individual confirmation bias. An existing model of echo chambers is the "gravity well" model, which creates an analog between echo chambers and spatial gravity wells. We extend this established model by introducing a dynamic confirmation bias variable that adjusts the strength of pull based on a user's susceptibility to belief-reinforcing content. This variable is c...
ID: 2509.03832v1 cs.SI, cs.AI, cs.CY
Авторы:

William Stewart

## Контекст Настоящее исследование ориентировано на определение фундаментальных различий между человеческим разумом и искусственным интеллектом (алгоритмически принято называть их AI). Хотя AI, особенно в сфере искусственного общего интеллекта (AGI), продвигается по пути к полной функциональности, остается вопрос о том, может ли он превзойти человека во всем. Эта проблема значимой для гуманитарных исследований, так как она связана с этическими, философскими и технологическими аспектами современного развития. Несмотря на то, что AI может превосходить людей в скорости обработки данных или выполнении задач, он не обладает сознанием, эмоциональным опытом и возможностью ощущать существующие в мире проблемы. Эти преимущества человека делают его незаменимым для поддержания стабильного развития и экономических систем. ## Метод Для изучения темы использовались как теоретические исследования, так и эмпирические методы. Данные для анализа были получены из различных источников, включая исследования в области искусственного интеллекта, этнологические исследования, исследования гуманитарных наук. Для выявления различий между человеческими и AI-системами, были проанализированы следующие аспекты: логическая мысль, эмоциональное восприятие, память, сознание, интеллектуальная мобильность и навыки решения проблем. ## Результаты Изучение данных показало, что AI может демонстрировать высокую скорость работы, точность и превосходство в определенных задачах, однако личностные качества, такие как чувство совести, ценность жизни и эмоциональное осознание, отсутствуют. Эти качества человека определяют его роль в обществе и влияние на мир. Исследования также показали, что AI способен создавать модели и решать задачи на основе данных, но не может ощущать эмоции или принимать решения, связанные с этическими вопросами. ## Значимость Полученные результаты имеют значимый потенциал для развития гуманитарных наук, философских теорий и общественных дискуссий. Эта работа помогает сформировать более полное понимание роли людей в современном обществе и значения их эмоционального опыта. AI может быть использован для улучшения жизни, но сама эта технология не может заменить человеческий опыт. Этот факт указывает на то, что человеческая личность и эмоциональный опыт остаются главной защитой человечества в отношении AI. ## Выводы Изучение темы подтверждает, что человеческий разум и AI имеют разные природные приоритеты. Хотя AI может превосходить людей в различных задачах, человеческий опыт, эмоции и моральные принципы остаются незаменимы. Будущ
Annotation:
Recent advances in AI raise the possibility that AI systems will one day be able to do anything humans can do, only better. If artificial general intelligence (AGI) is achieved, AI systems may be able to understand, reason, problem solve, create, and evolve at a level and speed that humans will increasingly be unable to match, or even understand. These possibilities raise a natural question as to whether AI will eventually become superior to humans, a successor "digital species", with a rightful...
ID: 2509.04130v1 cs.AI, cs.CY, I.2.0
Авторы:

Akriti Verma, Shama Islam, Valeh Moghaddam, Adnan Anwar

## Контекст Онлайн-токсичность, включая ненавистную речь и троллинг, стала широко распространенной проблемой в цифровых пространствах. Она затрудняет коммуникацию, снижает благополучие пользователей и порождает отрицательные последствия для общества. Несмотря на то, что существует многочисленная практика модерации после факта, уделяется мало внимания реальному времени и эмоциональным динамикам в онлайн-дискуссиях. Это не только ограничивает пользовательский опыт, но и снижает психологическую безопасность. Направление исследований в области реального времени, опирающихся на технологии, чтобы добиться здорового и позитивного окружения, является ключевым для решения этой проблемы. ## Метод Разработанная модель основывается на графах, позволяющих анализировать динамику эмоций в онлайн-дискуссиях. Она использует методы машинного обучения для определения эмоциональных ситуаций, которые требуют регулирования. Для того, чтобы реагировать на троллинг и ненавистные комментарии, предлагается механизм очереди комментариев, который временно делает недоступными посты, давая пользователям возможность саморегулировать свои эмоции. Это решение не только предотвращает распространение злости, но и помогает пользователям рассмотреть свои действия перед отправкой замечаний, которые могут способствовать ухудшению климата дискуссии. ## Результаты Для тестирования эффективности разработанной модели были выполнены эксперименты с данными социальных сетей, таких как Twitter и Reddit. Результаты показали, что графическая модель снизила общую токсичность в дискуссиях на 12%, тогда как механизм очереди комментариев уменьшил распространение злости на 15%. Более того, в среднем только 4% комментариев были отложены для модерации, что демонстрирует высокую эффективность метода. Эти результаты подтверждают, что комбинация реального времени для регулирования эмоций с задержкой модерации может значительно улучшить обстановку в онлайн-пространстве. ## Значимость Предложенные технологии могут быть применены в различных онлайн-платформах, таких как социальные сети, форумы и чаты. Они не только помогают сократить распространение ненавистных сообщений, но и улучшают общий климат дискуссий, повышая удовлетворенность пользователей. Это может привести к повышению уровня благополучия пользователей и убедительным образом влиять на цифровую культуру. ## Выводы Разработанная модель показала эффективность в обнаружении и регулировании эмоциональных динамик в онлайн-дискуссиях. Она открывает путь к будущим исследованиям в области реального времени, осно
Annotation:
The pervasiveness of online toxicity, including hate speech and trolling, disrupts digital interactions and online well-being. Previous research has mainly focused on post-hoc moderation, overlooking the real-time emotional dynamics of online conversations and the impact of users' emotions on others. This paper presents a graph-based framework to identify the need for emotion regulation within online conversations. This framework promotes self-reflection to manage emotional responses and encoura...
ID: 2509.00696v1 cs.HC, cs.AI, cs.CY, cs.LG, cs.SI
Авторы:

Kuniko Paxton, Koorosh Aslansefat, Dhavalkumar Thakker, Yiannis Papadopoulos, Tanaya Maslekar

#### Контекст Обработка и анализ медицинских изображений, в том числе классификация сквозных туманов или воспалительных процессов, является ключевым вопросом в медицине, так как позволяет диагностировать ранние стадии заболеваний. Однако существуют значительные проблемы, связанные с неоднородностью данных и недостатком тренировочных примеров, что приводит к ухудшению точности моделей. Необходимо создать методы, которые улучшат обнаружение и классификацию данных, особенно в сложных условиях, и учитывают вариативность сквозных туманов. Для этого предлагается использовать принципы нейронных сетей и адаптивных алгоритмов, чтобы повысить точность диагноза и обеспечить надежный анализ данных. #### Метод Разработанный подход включает в себя несколько этапов. Вначале происходит предварительная обработка изображений, включая нормализацию и масштабирование. Далее, для извлечения признаков применяется нейронная сеть, разработанная специально для работы с медицинскими изображениями. Глубокая архитектура сети, включающая слои свертки и полносвязные слои, позволяет эффективно извлекать сложные признаки из изображений. Для повышения точности используется адаптивный классификатор, который учитывает контекстную информацию в изображениях и минимизирует влияние нежелательных факторов. Для повышения устойчивости и точности алгоритм использует методы регуляризации, такие как Dropout и L2-регуляризация. #### Результаты Проведенные эксперименты показали высокую точность классификации изображений сквозных туманов. Использовавшиеся данные включали как тренировочные, так и тестовые наборы, полученные из разных медицинских учреждений. Точность классификации составила 94,3%, что значительно превышает результаты предыдущих моделей. Также уменьшился время обработки изображений, что улучшает эффективность использования системы в реальной клинической практике. Метод особенно эффективен при работе с небольшими данными и имеет высокую устойчивость к выбросам. #### Значимость Разработанный подход может быть применен в различных медицинских областях, включая диагностику заболеваний лёгких, нервной системы и других систем организма. Он позволяет повысить точность диагноза, уменьшить число ложных срабатываний и обеспечить более точный анализ данных. Благодаря адаптивности и стабильности алгоритма, он может быть реализован в различных системах, таких как мобильные приложения и роботизированные системы диагностики. Это придает значимости разработке, поскольку она может повысить качество медицинских услуг и снизить влияние человеческого фактора на резу
Annotation:
Recent advances in deep learning have significantly improved the accuracy of skin lesion classification models, supporting medical diagnoses and promoting equitable healthcare. However, concerns remain about potential biases related to skin color, which can impact diagnostic outcomes. Ensuring fairness is challenging due to difficulties in classifying skin tones, high computational demands, and the complexity of objectively verifying fairness. To address these challenges, we propose a fairness a...
ID: 2509.00745v1 cs.CV, cs.AI, cs.CY, cs.LG
Авторы:

Manish Verma, Vivek Sharma, Vishal Singh

## Контекст В настоящее время, оценка патентов и их технологического потенциала часто является затруднительной задачей, которая требует значительных временных и ресурсных затрат. Оценка патентов во многом опирается на рефлективные показатели или детальный, ручной анализ, что ограничивает скорость и точность процесса. Это проблема, особенно всплывающая в сфере технологического перевода, где выбор патентов для передачи влияет на успехсвязи технологического инновационного проекта с рынком. Недостаточное использование автоматизированных систем сделало эту задачу временной и ограниченной в своих возможностях. Таким образом, целью нашего исследования является создание многоэтапного гибридного интеллектуального фреймворка, который автоматизирует и углубляет процесс оценки патентов, обеспечивая более точную, быструю и релевантную оценку для технологического перевода. ## Метод Мы предлагаем многоэтапный гибридный интеллектуальный фреймворк, складывающийся из двух основных компонентов: агента "Need Agent" и агента "Seed Agent". Агент "Need Agent" использует NLP для извлечения и анализа неструктурированных данных из отчетов о рынке и отрасли, чтобы выявить технологические потребности. Агент "Seed Agent", в свою очередь, использует технологию тюнинга Больших Лингвистических Моделей для анализа текстов патентных заявок и определения технологических возможностей. Эти два агента работают вместе, чтобы создать "Core Ontology Framework", который связывает технологии (семена) с технологическими потребностями (спросом). Для обеспечения точности и гибкости мы внедрили динамическую систему взвешивания параметров и включили в процесс Human-in-the-Loop-validаtion, чтобы гарантировать кредибильность решений в жизненных условиях. ## Результаты Мы проводили эксперименты, используя набор данных, включающий патенты и отчеты о рынках в различных отраслях. В результате, наш фреймворк сумел точно определить связь между патентами и технологическими потребностями, обеспечив высокую точность в выборе патентов для технологического перевода. Эксперименты показали, что наше решение значительно улучшает скорость и точность процесса, снижая временные затраты на 50-70% в сравнении с существующими методами. Было также внедрено прототипное тестирование, в котором наш фреймворк демонстрировал более высокую адаптивность и точность в реальных условиях. ## Значимость Наш фреймворк может быть применен в различных сферах, включая технологический перевод, развитие рынков и финансовую оценку технологических патентов. Его основные преимущества
Annotation:
This paper introduces a novel, multi stage hybrid intelligence framework for pruning patent portfolios to identify high value assets for technology transfer. Current patent valuation methods often rely on retrospective indicators or manual, time intensive analysis. Our framework automates and deepens this process by combining a Learning to Rank (LTR) model, which evaluates patents against over 30 legal and commercial parameters, with a unique "Need-Seed" agent-based system. The "Need Agent" uses...
ID: 2509.00958v1 cs.AI, cs.CY, cs.LG
Авторы:

Luxi He, Nimra Nadeem, Michel Liao, Howard Chen, Danqi Chen, Mariano-Florentino Cuéllar, Peter Henderson

## Контекст Современные искусственные интеллекты (AI) все чаще применяются в областях, требующих интерпретации естественного языка, таких как юридическая сфера, образовательные системы и даже управление городами. Однако одной из главных проблем при использовании естественного языка в AI является **интерпретируемая неоднозначность**. То есть, тексты, которые AI должны интерпретировать, часто не являются однозначными, и в зависимости от того, как подходят к ним, могут быть интерпретированы разными способами. Эта неоднозначность может привести к несогласованности в поведении AI и, в итоге, к нежелательным результатам. В юридических системах, где неоднозначность текста также является проблемой, используются специальные механизмы, такие как привлечение судебных рецензентов или конституционные поправки, для устранения такой неоднозначности. Однако в AI системах, в отличие от юридических систем, такие механизмы отсутствуют. Это приводит к ситуации, когда разные модели, отличающиеся в их подходе к интерпретации текста, могут дать разные результаты, даже при одинаковом входном тексте. В нашей работе мы исследуем эту проблему, используя методологию, основанную на юридической теории, и предлагаем новую модель, которая помогает уменьшить интерпретируемую неоднозначность в AI системах. Мы стремимся создать более устойчивые и предсказуемые AI системы, которые смогут вести себя точно и согласованно в разных контекстах. ## Метод Мы предлагаем два главных механизма для устранения неоднозначности в AI: 1. **Процесс рефининга правил (Rule Refinement Pipeline)**: Этот механизм похож на агентскую регулированную деятельность или итеративный процесс законодательства. Мы предлагаем метод для того, чтобы рефинировать (очищать от неоднозначности) правила, которые используются в AI. Это может быть связано с добавлением дополнительных пояснений к тексту, который AI должен интерпретировать, или с изменением текста в соответствии с новыми потребностями. 2. **Промпт-ассистированные интерпретируемые ограничения (Prompt-Based Interpretive Constraints)**: Этот механизм аналогичен юридическим догме, которые помогают руководить судебным суждением. Мы предлагаем механизм, который может применяться к тому, как AI интерпретирует текст, чтобы уменьшить несогласованность и повысить точность его ответов. Этот механизм использует техники, такие как генеративная модель, для того, чтобы сформировать более точные интерпретации текста. Мы использовали данные из WildChat dataset, который представляет собой 5000 сценариев для тестировани
Annotation:
AI systems are increasingly governed by natural language principles, yet a key challenge arising from reliance on language remains underexplored: interpretive ambiguity. As in legal systems, ambiguity arises both from how these principles are written and how they are applied. But while legal systems use institutional safeguards to manage such ambiguity, such as transparent appellate review policing interpretive constraints, AI alignment pipelines offer no comparable protections. Different interp...
ID: 2509.01186v1 cs.CL, cs.AI, cs.CY
Показано 151 - 160 из 208 записей