📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 0

Последнее обновление: сегодня

📄 A Machine Learning Approach for Detection of Mental Health Conditions and Cyberbullying from Social Media

2025-11-27

Авторы:

Edward Ajayi, Martha Kachweka, Mawuli Deku, Emily Aiken

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Mental health challenges and cyberbullying are increasingly prevalent in digital spaces, necessitating scalable and interpretable detection systems. This paper introduces a unified multiclass classification framework for detecting ten distinct mental health and cyberbullying categories from social media data. We curate datasets from Twitter and Reddit, implementing a rigorous "split-then-balance" pipeline to train on balanced data while evaluating on a realistic, held-out imbalanced test set. We...

ID: 2511.20001v1 cs.CL, cs.SI

arXiv PDF

📄 Listening Between the Lines: Decoding Podcast Narratives with Language Modeling

2025-11-11

Авторы:

Shreya Gupta, Ojasva Saxena, Arghodeep Nandi, Sarah Masud, Kiran Garimella, Tanmoy Chakraborty

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Podcasts have become a central arena for shaping public opinion, making them a vital source for understanding contemporary discourse. Their typically unscripted, multi-themed, and conversational style offers a rich but complex form of data. To analyze how podcasts persuade and inform, we must examine their narrative structures -- specifically, the narrative frames they employ. The fluid and conversational nature of podcasts presents a significant challenge for automated analysis. We show that ...

ID: 2511.05310v1 cs.CL, cs.SI

arXiv PDF

📄 Can MLLMs Read the Room? A Multimodal Benchmark for Verifying Truthfulness in Multi-Party Social Interactions

2025-11-05

Авторы:

Caixin Kang, Yifei Huang, Liangyang Ouyang, Mingfang Zhang, Yoichi Sato

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

As AI systems become increasingly integrated into human lives, endowing them with robust social intelligence has emerged as a critical frontier. A key aspect of this intelligence is discerning truth from deception, a ubiquitous element of human interaction that is conveyed through a complex interplay of verbal language and non-verbal visual cues. However, automatic deception detection in dynamic, multi-party conversations remains a significant challenge. The recent rise of powerful Multimodal La...

ID: 2510.27195v2 cs.CV, cs.CL, cs.SI

arXiv PDF

📄 Can MLLMs Read the Room? A Multimodal Benchmark for Verifying Truthfulness in Multi-Party Social Interactions

2025-11-04

Авторы:

Caixin Kang, Yifei Huang, Liangyang Ouyang, Mingfang Zhang, Yoichi Sato

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

ID: 2510.27195v1 cs.CV, cs.CL, cs.SI

arXiv PDF

📄 Social Simulations with Large Language Model Risk Utopian Illusion

2025-10-28

Авторы:

Ning Bian, Xianpei Han, Hongyu Lin, Baolei Wu, Jun Wang

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Reliable simulation of human behavior is essential for explaining, predicting, and intervening in our society. Recent advances in large language models (LLMs) have shown promise in emulating human behaviors, interactions, and decision-making, offering a powerful new lens for social science studies. However, the extent to which LLMs diverge from authentic human behavior in social contexts remains underexplored, posing risks of misinterpretation in scientific studies and unintended consequences in...

ID: 2510.21180v1 cs.CL, cs.SI

arXiv PDF

📄 A Generalizable Rhetorical Strategy Annotation Model Using LLM-based Debate Simulation and Labelling

2025-10-21

Авторы:

Shiyu Ji, Farnoosh Hashemi, Joice Chen, Juanwen Pan, Weicheng Ma, Hefan Zhang, Sophia Pan, Ming Cheng, Shubham Mohole, Saeed Hassanpour, Soroush Vosoughi, Michael Macy

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Rhetorical strategies are central to persuasive communication, from political discourse and marketing to legal argumentation. However, analysis of rhetorical strategies has been limited by reliance on human annotation, which is costly, inconsistent, difficult to scale. Their associated datasets are often limited to specific topics and strategies, posing challenges for robust model development. We propose a novel framework that leverages large language models (LLMs) to automatically generate and ...

ID: 2510.15081v1 cs.CL, cs.SI

arXiv PDF

📄 Good Intentions Beyond ACL: Who Does NLP for Social Good, and Where?

2025-10-08

Авторы:

Grace LeFevre, Qingcheng Zeng, Adam Leif, Jason Jewell, Denis Peskoff, Rob Voigt

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

The social impact of Natural Language Processing (NLP) is increasingly important, with a rising community focus on initiatives related to NLP for Social Good (NLP4SG). Indeed, in recent years, almost 20% of all papers in the ACL Anthology address topics related to social good as defined by the UN Sustainable Development Goals (Adauto et al., 2023). In this study, we take an author- and venue-level perspective to map the landscape of NLP4SG, quantifying the proportion of work addressing social go...

ID: 2510.04434v1 cs.CL, cs.SI

arXiv PDF

📄 Internal World Models as Imagination Networks in Cognitive Agents

2025-10-08

Авторы:

Saurabh Ranjan, Brian Odegaard

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

What is the computational objective of imagination? While classical interpretations suggest imagination is useful for maximizing rewards, recent findings challenge this view. In this study, we propose that imagination serves to access an internal world model (IWM) and use psychological network analysis to explore IWMs in humans and large language models (LLMs). Specifically, we assessed imagination vividness ratings using two questionnaires and constructed imagination networks from these reports...

ID: 2510.04391v1 cs.AI, cs.CL, cs.SI, q-bio.NC

arXiv PDF

📄 Knowledge Homophily in Large Language Models

2025-10-01

Авторы:

Utkarsh Sahu, Zhisheng Qi, Mahantesh Halappanavar, Nedim Lipka, Ryan A. Rossi, Franck Dernoncourt, Yu Zhang, Yao Ma, Yu Wang

#### Контекст Large Language Models (LLMs) являются мощными инструментами для поддержки знаний-интенсивных приложений, таких как вопрос-ответ и проверка фактов. Однако структура, в которой хранится их знание, пока остается недостаточно изученной. Это ограничивает возможности для эффективного управления и расширения знаний внутри этих моделей. Наблюдения из когнитивной науки, такие как семантическое кластеризация и прайминг, описывают связь между знаниями, при которой знание одного факта повышает вероятность помнить связанные с ним факты. Эта теория подсказывает, что LLMs также могут иметь аналогичную структуру. Несмотря на высокую точность LLMs, неясно, как их знания организованы, что делает необходимым подробное исследование. Наша мотивация заключается в выявлении и использовании этой структуры для улучшения эффективности и точности работы LLMs. #### Метод Для изучения структуры знаний в LLMs мы представляем их в виде графа, где узлы представляют собой сущности, а рёбра — отношения между ними, определяемые знаниями, которые модель обладает. Для построения этого графа используется техника знаний-проверки на двух уровнях: триплетах и сущностях. Это позволяет определить, насколько хорошо LLM знает отдельные факты и отношения. Затем мы проводим анализ взаимосвязи знаний между сущностями, определяя, насколько знания одной сущности похожи на знания её соседних в графе. Это позволяет выделить тренд: ближайшие в графе сущности имеют более похожие уровни знаний. Основываясь на этой идее, мы предложили Graph Neural Network (GNN) для регрессионной оценки уровня знаний для каждого триплета, используя знания соседей в графе. #### Результаты Мы провели эксперименты с широким спектром данных, включая TripleGraph и внешние ресурсы, чтобы проверить эффективность нашей модели. Результаты показали, что GNN-модель успешно предсказывает уровень знаний для триплетов, оптимизируя покрытие знаний в пределах ограниченного бюджета. Это приводит к улучшению активного метода лейблинга, который требуется для развития модели. Также, мы продемонстрировали, что наш подход повышает эффективность рассуждений в задачах вопроса-ответа, позволяя лучше организовывать поиск путей во многоступенчатых задачах. #### Значимость Предложенный подход имеет широкие потенциальные применения в области знаний-интенсивных приложений. Он позволяет улучшить эффективность активного лейблинга, обеспечивая более точный выбор триплетов для лейблинга, чтобы получить максимальное покрытие новых знаний с минимальными зат

Annotation:

Large Language Models (LLMs) have been increasingly studied as neural knowledge bases for supporting knowledge-intensive applications such as question answering and fact checking. However, the structural organization of their knowledge remains unexplored. Inspired by cognitive neuroscience findings, such as semantic clustering and priming, where knowing one fact increases the likelihood of recalling related facts, we investigate an analogous knowledge homophily pattern in LLMs. To this end, we m...

ID: 2509.23773v1 cs.LG, cs.AI, cs.CL, cs.SI

arXiv PDF

📄 MPCG: Multi-Round Persona-Conditioned Generation for Modeling the Evolution of Misinformation with LLMs

2025-09-24

Авторы:

Jun Rong Brian Chong, Yixuan Tang, Anthony K. H. Tung

#### Контекст Моделирование распространения и эволюции мифиформ (misinformation) является сложной задачей, которую сложно выполнить с помощью статических моделей. Текущие подходы к оценке мифиформ основываются на предположении, что мифиформы неизменны. Однако на самом деле они часто изменяются в ходе распространения, адаптируясь к новым аудиториям. Эти изменения могут включать изменения языка, формулировок, моральных аспектов и перспектив. Наша работа сфокусирована на создании модели, которая будет эмулировать этот процесс эволюции мифиформ. Именно этой проблеме мы посвятили нашу исследовательскую работу. #### Метод Мы предлагаем Multi-Round Persona-Conditioned Generation (MPCG) — метод, который имитирует эволюцию мифиформ с помощью нескольких итераций. Мы используем неуправляемую модель языка (LLM), чтобы сгенерировать тексты, которые были бы адаптированы под разные персонажи в каждой итерации. Для этого мы используем выход от предыдущих итераций, чтобы усложнить итоговый результат. Мы также применяем метрики для оценки того, насколько хорошо модель справляется с этим задачей на практике. Это включает в себя не только читабельность и семантическую связность, но и метрики эмоциональной и моральной окраски текста. #### Результаты Мы провели подробные эксперименты, используя широкий спектр данных. Мы оценивали нашу модель с помощью различных задач: от анализа читабельности и понимаемости до оценки эмоциональных и моральных аспектов текстов. Наши результаты демонстрируют, что модель MPCG способна эффективно эмулировать эволюцию мифиформ, сохраняя семантическую связность между итерациями. Мы также исследовали возможность использования наших генерируемых данных в задачах классификации и оценки мифиформ. #### Значимость Модель MPCG может быть применена в различных областях, в том числе для моделирования эволюции мифиформ, анализа распространения информации, и для повышения точности моделей классификации. Одним из главных преимуществ этого подхода является то, что он позволяет исследовать не только содержание мифиформ, но и их ментальный эффект на различные группы пользователей. Мы также показали, что наш подход может сделать модели классификации мифиформ более устойчивыми к изменениям в тексте. #### Выводы Мы представили MPCG — модель, которая эмулирует эволюцию мифиформ с помощью нескольких итераций. Наши результаты показывают, что модель эффективно работает в задачах, связанных с моделированием и анализом мифиформ. Мы также выявили необходимость дальнейшего исследования в области моделирования эмоционального

Annotation:

Misinformation evolves as it spreads, shifting in language, framing, and moral emphasis to adapt to new audiences. However, current misinformation detection approaches implicitly assume that misinformation is static. We introduce MPCG, a multi-round, persona-conditioned framework that simulates how claims are iteratively reinterpreted by agents with distinct ideological perspectives. Our approach uses an uncensored large language model (LLM) to generate persona-specific claims across multiple ro...

ID: 2509.16564v1 cs.CL, cs.SI

arXiv PDF

Показано 1 - 10 из 20 записей