📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня

📄 Somatic in the East, Psychological in the West?: Investigating Clinically-Grounded Cross-Cultural Depression Symptom Expression in LLMs

2025-08-09

Авторы:

Shintaro Sakai, Jisun An, Migyeong Kang, Haewoon Kwak

Научная статья «Somatic in the East, Psychological in the West? Investigating Clinically-Grounded Cross-Cultural Depression Symptom Expression in LLMs» расследует, насколько удачно широко применяемые технологии, такие как Large Language Models (LLMs), могут воспроизвести культурные паттерны выражения симптомов депрессии. Результаты экспериментов показывают, что LLMs, протестированные на Западных и Восточных культурных лицах, слабо воспроизводят культурные уточнения в переводе на английский, хотя в определенных условиях могут точнее отразить типичные для Востока сущностные симптомы. Основные причины неудач просты: LLMs недостаточно чувствительны к культурным контекстам, и их внутренняя симптомная иерархия оказывается культурно независима. Эти находки подчеркивают необходимость развития более культурно чувствительных моделей AI для безопасных и эффективных применений в сфере психиатрии.

Annotation:

Prior clinical psychology research shows that Western individuals with depression tend to report psychological symptoms, while Eastern individuals report somatic ones. We test whether Large Language Models (LLMs), which are increasingly used in mental health, reproduce these cultural patterns by prompting them with Western or Eastern personas. Results show that LLMs largely fail to replicate the patterns when prompted in English, though prompting in major Eastern languages (i.e., Chinese, Japane...

ID: 2508.03247v1 cs.CL, cs.CY

arXiv PDF

📄 Exploring Stability-Plasticity Trade-offs for Continual Named Entity Recognition

2025-08-09

Авторы:

Duzhen Zhang, Chenxing Li, Jiahua Dong, Qi Liu, Dong Yu

**Резюме** В статье предлагается метод Stability-Plasticity Trade-off (SPT) для проблемы Continual Named Entity Recognition (CNER), связанной с последовательным обновлением модели для распознавания новых сущностей, учитывая необходимость сохранения предыдущего знания. Основная проблема — тенденция традиционных подходов, основанных на Knowledge Distillation (KD), к сильному сохранению старого знания за счет ограниченной пластичности (поглощения нового). SPT метод расширяет оригинальный KD с помощью пулинга для добиваться баланса между стабильностью и пластичностью. Он также включает в себя динамическую систему слияния весов старых и новых моделей, а также стратегию подбора значимых весов. Кроме того, предложен улучшенный метод подбора pseduo-labels для неизвестных сущностей, обрабатывающий семантические сдвиги, которые были прежде недооценены. Результаты на трех бенчмарковых датасетах показали, что SPT превосходит предыдущие подходы, достигая более эффективного баланса стабильности и пластичности в CNER.

Annotation:

Continual Named Entity Recognition (CNER) is an evolving field that focuses on sequentially updating an existing model to incorporate new entity types. Previous CNER methods primarily utilize Knowledge Distillation (KD) to preserve prior knowledge and overcome catastrophic forgetting, strictly ensuring that the representations of old and new models remain consistent. Consequently, they often impart the model with excessive stability (i.e., retention of old knowledge) but limited plasticity (i.e....

ID: 2508.03259v1 cs.CL

arXiv PDF

📄 LECTOR: LLM-Enhanced Concept-based Test-Oriented Repetition for Adaptive Spaced Learning

2025-08-09

Авторы:

Jiahao Zhao

**Резюме** Успешное обучение часто полагается на системы пространственного повторения, но существующие алгоритмы часто сталкиваются с проблемами семантической интерференции и персонализацией. Мы предлагаем LECTOR (LLM-Enhanced Concept-based Test-Oriented Repetition) — новую адаптивную схему расписания, ориентированную на оценку знаний, особенно для языковых экзаменов. LECTOR использует бо LLM для семантического анализа и профиля персонального обучения, чтобы решить проблему семантической путаницы при изучении лексики. Это реализовано через технологию LLM-поддержки оценки семантической близости и интеграцию с принципами пространственного повторения. Наши эксперименты с 100 симулированными обучаемыми на 100 дней показали, что LECTOR демонстрирует 90,2% успеха против 88,4% лучшего из базовых алгоритмов (SSP-MMC), что является значительным улучшением. Благодаря эффективному обработке похожих понятий, LECTOR снижает ошибки, связанные с путаницей, при этом сохраняя высокую эффективность вычислений. Эти результаты устанавливают LECTOR как надежную платформу для развития интеллектуальных систем обучения и адаптивных образовательных платформ.

Annotation:

Spaced repetition systems are fundamental to efficient learning and memory retention, but existing algorithms often struggle with semantic interference and personalized adaptation. We present LECTOR (\textbf{L}LM-\textbf{E}nhanced \textbf{C}oncept-based \textbf{T}est-\textbf{O}riented \textbf{R}epetition), a novel adaptive scheduling algorithm specifically designed for test-oriented learning scenarios, particularly language examinations where success rate is paramount. LECTOR leverages large lan...

ID: 2508.03275v1 cs.CL

arXiv PDF

📄 Do language models accommodate their users? A study of linguistic convergence

2025-08-09

Авторы:

Terra Blevins, Susanne Schmalwieser, Benjamin Roth

Многие мыслят, что большие языковые модели (LLM) профессионально генерируют текст, но их умение конвергировать к языковым паттернам пользователя — недостаточно изученный вопрос. Данная работа рассматривает, адаптируют ли модели свой стиль к стилю собеседника, анализируя 16 моделей, 3 диалоговых корпуса и стилетические признаки. Оказалось, что модели сильно конвергируют к стилю беседы, иногда даже превышая человеческий базис. Однако этот эффект зависит от типа обучения и размера модели: instruction-tuned и более крупные модели конвергируют менее чем их предварительно обученные аналоги. Несмотря на сходство стиля, разница в механизмах конвергенции человека и модели подчеркивает необходимость дальнейшего исследования для повышения естественности интерактивных диалогов.

Annotation:

While large language models (LLMs) are generally considered proficient in generating language, how similar their language usage is to that of humans remains understudied. In this paper, we test whether models exhibit linguistic convergence, a core pragmatic element of human language communication, asking: do models adapt, or converge, to the linguistic patterns of their user? To answer this, we systematically compare model completions of exisiting dialogues to the original human responses across...

ID: 2508.03276v1 cs.CL

arXiv PDF

📄 Understanding the Embedding Models on Hyper-relational Knowledge Graph

2025-08-09

Авторы:

Yubo Wang, Shimin Di, Zhili Wang, Haoyang Li, Fei Teng, Hao Xin, Lei Chen

Задача: Развитие и адаптация моделей для гипер-реляционных знаний (Hyper-relational Knowledge Graphs, HKGs), которые расширяют классические Knowledge Graphs (KGs) для подробного представления фактов с дополнительными квалификаторами. Однако неясно, допускаются ли повышенные показатели новых HKGE-моделей благодаря базовой модели KGE или специальным модулям обработки квалификаторов. Предлагаемое решение: Авторы предлагают конвертировать HKGs в формат KGs с помощью трех методов декомпозиции и сравнить показатели классических KGE-моделей с HKGE-моделями. Они также выявили ограничения декомпозиционных подходов и улучшения HKGE-моделей, такие как недостаточность в хранении длинных зависимостей или интеграции простых троек и квалификаторов. Основные выводы: Новые модели, такие как FormerGNN, которая сочетает квалификаторный интегратор и графовый кодировщик на основе GNN, показала значительное улучшение в сравнении с имеющимися решениями. Результаты подтверждают возможность улучшения обработки гипер-реляционных знаний с помощью новых парадигм.

Annotation:

Recently, Hyper-relational Knowledge Graphs (HKGs) have been proposed as an extension of traditional Knowledge Graphs (KGs) to better represent real-world facts with additional qualifiers. As a result, researchers have attempted to adapt classical Knowledge Graph Embedding (KGE) models for HKGs by designing extra qualifier processing modules. However, it remains unclear whether the superior performance of Hyper-relational KGE (HKGE) models arises from their base KGE model or the specially design...

ID: 2508.03280v1 cs.LG, cs.CL, cs.SI

arXiv PDF

📄 Towards Trustworthy Multimodal Moderation via Policy-Aligned Reasoning and Hierarchical Labeling

2025-08-09

Авторы:

Anqi Li, Wenwei Jin, Jintao Tong, Pengda Qin, Weijia Li, Guo Lu

Многие социальные платформы сталкиваются с проблемой распространения вредоносного и несоответствующего политикам контента. Традиционные модели модерации слишком нацелены на эффективность и часто производят неточные и непонятные решения, что затрудняет их контроль людьми. В статье предлагается фреймворк **Hi-Guard**, решающий эти проблемы за счет интеграции политико-ориентированного рассуждения и гибридной моделирования. Он включает две стадии модерации: первичную бинарную фильтрацию и вторичную тонкослойную классификацию с использованием гибридной техники path-based classification. Модель интегрирует определения политик непосредственно в процесс рассуждения, что обеспечивает лучшую адаптацию к изменяющимся политикам. Для повышения качества предсказаний и интерпретабельности был введен Group Relative Policy Optimization (GRPO), который устраняет семантически близкие ошибки. Исследования показали, что Hi-Guard превосходит существующие модели по точности классификации, общей универсальности и четкости выводов, делая модерацию более надежной и прозрачной.

Annotation:

Social platforms have revolutionized information sharing, but also accelerated the dissemination of harmful and policy-violating content. To ensure safety and compliance at scale, moderation systems must go beyond efficiency and offer accuracy and interpretability. However, current approaches largely rely on noisy, label-driven learning, lacking alignment with moderation rules and producing opaque decisions that hinder human review. Therefore, we propose Hierarchical Guard (Hi-Guard), a multimod...

ID: 2508.03296v1 cs.CL, cs.LG

arXiv PDF

📄 Taggus: An Automated Pipeline for the Extraction of Characters' Social Networks from Portuguese Fiction Literature

2025-08-09

Авторы:

Tiago G Canário, Catarina Duarte, Flávio L. Pinheiro, João L. M. Pereira

В статье предлагается Taggus, автоматизированная конвейерная система для выделения социальных сетей персонажей из русской художественной литературы. Данная задача требует решения сложных проблем, включая идентификацию персонажей и их взаимоотношений, которые трудно решить с помощью имеющихся методов NLP. Основной проблемой является нехватка тренировочных данных в менее представленных языках, что приводит к низкому качеству готовых методов. Taggus использует POS-тегирование и геометрические методы для выделения социальных сетей, показывая высокую эффективность: F1-Score $94.1\%$ при определении персонажей и $75.9\%$ при выявлении их взаимодействий, что значительно превышает результаты состоящих в составе State-of-the-Art. Таким образом, Taggus представляет собой первый шаг к решению этой проблемы в немногочисленной литературе на этот счет. Доступность системы в открытом доступе позволяет способствовать дальнейшему развитию методов в этой области.

Annotation:

Automatically identifying characters and their interactions from fiction books is, arguably, a complex task that requires pipelines that leverage multiple Natural Language Processing (NLP) methods, such as Named Entity Recognition (NER) and Part-of-speech (POS) tagging. However, these methods are not optimized for the task that leads to the construction of Social Networks of Characters. Indeed, the currently available methods tend to underperform, especially in less-represented languages, due to...

ID: 2508.03358v1 cs.CL, cs.IR

arXiv PDF

📄 Thinking with Nothinking Calibration: A New In-Context Learning Paradigm in Reasoning Large Language Models

2025-08-09

Авторы:

Haotian Wu, Bo Xu, Yao Shu, Menglin Yang, Chengwei Qin

**Резюме** В статье предлагается новый подход Thinking with Nothinking Calibration (JointThinking) для улучшения возможностей in-context learning (ICL) в технических текстах. Опираясь на различия между двумя режимами рассуждения — Thinking и Nothinking, подход позволяет модели обладать более точным и стабильным резолюционным поverем. Фундаментально, JointThinking использует два альтернативных ответа, полученных в двух режимах рассуждения, и запускает второй Thinking-режим только в случае несоответствия ответов. Эта стратегия снижает затраты ресурсов, так как полноценное логическое рассуждение возможно только в относительно редких случаях. Эксперименты показали, что JointThinking демонстрирует улучшение качества ответов, увеличивая их точность и устойчивость по сравнению с цепочкой мыслей (chain-of-thought, CoT) и многоклассовым голосованием. Он показал высокую совместимость с подходами на основе тренировки (SOTA) в целостных задачах, но был более эффективен в выносимых задачах. Анализ показал, что модель может существенно улучшить свою качественную оценку различных модальностей. Основной вывод: различные логические режимы могут помочь в построении более устойчивых моделей по верификации и логическому рассуждению.

Annotation:

Reasoning large language models (RLLMs) have recently demonstrated remarkable capabilities through structured and multi-step reasoning. While prior research has primarily focused on improving their training and inference strategies, their potential for in-context learning (ICL) remains largely underexplored. To fill this gap, we propose Thinking with Nothinking Calibration (JointThinking), a new ICL paradigm that leverages the structured difference between two reasoning modes, i.e., Thinking and...

ID: 2508.03363v2 cs.CL

arXiv PDF

📄 ReDSM5: A Reddit Dataset for DSM-5 Depression Detection

2025-08-09

Авторы:

Eliseo Bao, Anxo Pérez, Javier Parapar

Депрессия — широко распространенное психиатрическое заболевание, часто оставаясь нераспознанным из-за проблем с доступом к клинической помощи и существующего стереотипа. Социальные сети, в том числе Reddit, хранят богатые пользовательские текстовые данные, которые могут выявлять ранние признаки депрессии. Однако существующие модели часто классифицируют посты как депрессивные или не депрессивные без связи с клиническими критериями DSM-5, что ограничивает их клиническую значимость и понятность. Для решения этой проблемы представлен ReDSM5 — корпус Reddit с 1484 постами, подробно аннотированными на уровне предложений лицензированным психологом с использованием DSM-5 симптомов. Каждый симптом сопровождается клиническим обоснованием. Этот ресурс позволяет развивать модели, которые не только обнаружат депрессию, но и обеспечат интерпретируемый клинический разбор. Были получены бенчмарки для классификации симптомов и генерации выводов, подкрепляющие будущие исследования в этой области.

Annotation:

Depression is a pervasive mental health condition that affects hundreds of millions of individuals worldwide, yet many cases remain undiagnosed due to barriers in traditional clinical access and pervasive stigma. Social media platforms, and Reddit in particular, offer rich, user-generated narratives that can reveal early signs of depressive symptomatology. However, existing computational approaches often label entire posts simply as depressed or not depressed, without linking language to specifi...

ID: 2508.03399v1 cs.CL

arXiv PDF

📄 Variety Is the Spice of Life: Detecting Misinformation with Dynamic Environmental Representations

2025-08-09

Авторы:

Bing Wang, Ximing Li, Yiming Wang, Changchun Li, Jiaxu Cui, Renchu Guan, Bo Yang

Ускоряющееся распространение лживых сведений в социальных сетях стало серьезной проблемой, вызывающей вредные последствия. Основная проблема существующих методов заключается в использовании статической модели, которая не учитывает динамическую природу социального окружения, в котором меняется статус новостей. Для решения этой проблемы предложено развитие нового подхода, **Misinformation Detection with Dynamic Environmental Representations (MISDER)**. Основной идеей этой модели является создание динамического представления социального окружения и прогнозирование его изменений с помощью темпоральных моделей, таких как LSTM, непрерывные динамические уравнения и предварительно обученные динамические системы. Модель MISDER была сравнена с другими подходами на двух популярных датасетах, и результаты показали высокую эффективность динамического подхода в обнаружении лживых сведений.

Annotation:

The proliferation of misinformation across diverse social media platforms has drawn significant attention from both academic and industrial communities due to its detrimental effects. Accordingly, automatically distinguishing misinformation, dubbed as Misinformation Detection (MD), has become an increasingly active research topic. The mainstream methods formulate MD as a static learning paradigm, which learns the mapping between the content, links, and propagation of news articles and the corres...

ID: 2508.03420v1 cs.CL, cs.SI

arXiv PDF

Показано 7281 - 7290 из 7506 записей