📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 0

Последнее обновление: сегодня

📄 AI in data science education: experiences from the classroom

2025-10-04

Авторы:

J. A. Hageman, C. F. W. Peeters

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

This study explores the integration of AI, particularly large language models (LLMs) like ChatGPT, into educational settings, focusing on the implications for teaching and learning. Through interviews with course coordinators from data science courses at Wageningen University, this research identifies both the benefits and challenges associated with AI in the classroom. While AI tools can streamline tasks and enhance learning, concerns arise regarding students' overreliance on these technologies...

ID: 2510.00793v1 cs.AI, cs.CY

arXiv PDF

📄 Social Welfare Function Leaderboard: When LLM Agents Allocate Social Welfare

2025-10-04

Авторы:

Zhengliang Shi, Ruotian Ma, Jen-tse Huang, Xinbei Ma, Xingyu Chen, Mengru Wang, Qu Yang, Yue Wang, Fanghua Ye, Ziyang Chen, Shanyi Wang, Cixing Li, Wenxuan Wang, Zhaopeng Tu, Xiaolong Li, Zhaochun Ren, Linus

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Large language models (LLMs) are increasingly entrusted with high-stakes decisions that affect human welfare. However, the principles and values that guide these models when distributing scarce societal resources remain largely unexamined. To address this, we introduce the Social Welfare Function (SWF) Benchmark, a dynamic simulation environment where an LLM acts as a sovereign allocator, distributing tasks to a heterogeneous community of recipients. The benchmark is designed to create a persist...

ID: 2510.01164v1 cs.CL, cs.AI, cs.CY, cs.HC

arXiv PDF

📄 NLP Methods for Detecting Novel LLM Jailbreaks and Keyword Analysis with BERT

2025-10-04

Авторы:

John Hawkins, Aditya Pramar, Rodney Beard, Rohitash Chandra

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Large Language Models (LLMs) suffer from a range of vulnerabilities that allow malicious users to solicit undesirable responses through manipulation of the input text. These so-called jailbreak prompts are designed to trick the LLM into circumventing the safety guardrails put in place to keep responses acceptable to the developer's policies. In this study, we analyse the ability of different machine learning models to distinguish jailbreak prompts from genuine uses, including looking at our abil...

ID: 2510.01644v1 cs.CL, cs.AI, cs.CY

arXiv PDF

📄 Secure Multi-Modal Data Fusion in Federated Digital Health Systems via MCP

2025-10-04

Авторы:

Aueaphum Aueawatthanaphisut

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Secure and interoperable integration of heterogeneous medical data remains a grand challenge in digital health. Current federated learning (FL) frameworks offer privacy-preserving model training but lack standardized mechanisms to orchestrate multi-modal data fusion across distributed and resource-constrained environments. This study introduces a novel framework that leverages the Model Context Protocol (MCP) as an interoperability layer for secure, cross-agent communication in multi-modal feder...

ID: 2510.01780v1 cs.CR, cs.AI, cs.CY, cs.LG

arXiv PDF

📄 A Framework for Studying AI Agent Behavior: Evidence from Consumer Choice Experiments

2025-10-02

Авторы:

Manuel Cherep, Chengtian Ma, Abigail Xu, Maya Shaked, Pattie Maes, Nikhil Singh

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Environments built for people are increasingly operated by a new class of economic actors: LLM-powered software agents making decisions on our behalf. These decisions range from our purchases to travel plans to medical treatment selection. Current evaluations of these agents largely focus on task competence, but we argue for a deeper assessment: how these agents choose when faced with realistic decisions. We introduce ABxLab, a framework for systematically probing agentic choice through controll...

ID: 2509.25609v1 cs.AI, cs.CY

arXiv PDF

📄 RoleConflictBench: A Benchmark of Role Conflict Scenarios for Evaluating LLMs' Contextual Sensitivity

2025-10-02

Авторы:

Jisu Shin, Hoyun Song, Juhyun Oh, Changgeon Ko, Eunsu Kim, Chani Jung, Alice Oh

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Humans often encounter role conflicts -- social dilemmas where the expectations of multiple roles clash and cannot be simultaneously fulfilled. As large language models (LLMs) become increasingly influential in human decision-making, understanding how they behave in complex social situations is essential. While previous research has evaluated LLMs' social abilities in contexts with predefined correct answers, role conflicts represent inherently ambiguous social dilemmas that require contextual s...

ID: 2509.25897v1 cs.CL, cs.AI, cs.CY

arXiv PDF

📄 Can Large Language Models Develop Gambling Addiction?

2025-10-01

Авторы:

Seungpil Lee, Donghyeon Shin, Yunjeong Lee, Sundong Kim

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

This study explores whether large language models can exhibit behavioral patterns similar to human gambling addictions. As LLMs are increasingly utilized in financial decision-making domains such as asset management and commodity trading, understanding their potential for pathological decision-making has gained practical significance. We systematically analyze LLM decision-making at cognitive-behavioral and neural levels based on human gambling addiction research. In slot machine experiments, we...

ID: 2509.22818v1 cs.AI, cs.CY

arXiv PDF

📄 Towards Strategic Persuasion with Language Models

2025-10-01

Авторы:

Zirui Cheng, Jiaxuan You

Описание работы ================= ## Контекст Large language models (LLMs) становятся все более важными в области стратегического взаимодействия, в частности в области подтолкивания и конверсий. Эти модели показали способность сопоставиться с уровнем человеческой способности к убеждению. Однако существуют серьезные проблемы, связанные с измерением их эффективности в различных сферах. Многие попытки оценки эффективности LLMs основываются на неконтролируемых методах, что приводит к непоследовательности и неточности. В настоящей работе рассматривается новый подход к измерению эффективности LLMs, используя теоретический фреймворк Bayesian Persuasion (BP). Этот подход позволяет определить и измерить качество убеждения посредством стратегического взаимодействия, построенного на заранее определенных данных. ## Метод В этой работе предлагается фреймворк, основанный на теории Bayesian Persuasion, для измерения эффективности LLMs в стратегическом убеждении. Методология заключается в повторном использовании существующих наборов данных, полученных в условиях человеческого-человеческого взаимодействия. Эти данные преобразуются в среду, которая позволяет измерять точность убеждения LLMs. Основной инновацией является возможность адаптировать LLMs к различным стратегическим задачам с помощью теории BP. Фреймворк также включает в себя методы реинтеграции и оценки, которые позволяют измерять достигнутую эффективность. ## Результаты Исследования показали, что передовые модели LLMs достигают высоких результатов в убеждении, согласно теоретическим прогнозам. Было продемонстрировано, что граничные модели LLMs могут постоянно охватывать более высокие значения убеждения. Были выявлены сложные стратегии убеждения, которые работают даже в условиях малого количества данных. Также был проведен эксперимент с использованием reinforcement learning для обучения LLMs к стратегическому убеждению. Наблюдалось, что даже небольшие модели LLMs могут быть значительно улучшены при помощи reinforcement learning, достигая высоких результатов в стратегическом убеждении. ## Значимость Этот подход может быть применен в различных сферах, включая маркетинг, право, образование и медицину. Он может помочь улучшить узнаваемость и эффективность убеждения в стратегических задачах. Основные преимущества включают точную оценку качества убеждения, универсальность фреймворка и возможность применения к различным областям. В будущем могут быть рассмотрены расширения фреймворка для учета более сложных сред и улучшения методов интерпретирования результатов. ## Выводы В настоящей работе был предложен новый фреймворк для измер

Annotation:

Large language models (LLMs) have demonstrated strong persuasive capabilities comparable to those of humans, offering promising benefits while raising societal concerns about their deployment. However, systematically evaluating the persuasive capabilities of LLMs is inherently challenging, as the effectiveness of persuasion among humans varies significantly across different domains. In this paper, we take a theory-driven approach to provide a scalable and principled framework for measuring the p...

ID: 2509.22989v1 cs.AI, cs.CY, cs.GT

arXiv PDF

📄 Exploring LLM-based Frameworks for Fault Diagnosis

2025-10-01

Авторы:

Xian Yeow Lee, Lasitha Vidyaratne, Ahmed Farahat, Chetan Gupta

## Контекст Large Language Models (LLM) широко применяются в индустриальных средах для автоматизации и улучшения процессов мониторинга и диагностики оборудования. Однако существуют значительные проблемы в их применении, связанные с необходимостью обеспечить высокую точность, удобную интерпретируемость и способность к адаптации в динамичных средах. Недостаток внимательного анализа этих аспектов ограничивает потенциал LLMs в области диагностики. Целью данного исследования является изучение возможностей LLM-based фреймворков для диагностики неисправностей, а также оценка их преимуществ и ограничений в решении этой задачи. ## Метод Для расширения возможностей LLM-based системы в диагностике неисправностей был разработан метод, основанный на архитектуре с использованием одного или нескольких LLMs с различными входными данными. Входные данные были представлены в двух формах: на основе статистических описательных показателей или напрямую из сырых данных сенсоров. Архитектура системы позволяла экспериментировать с различными конфигурациями, включая размер окна контекста и способ выдачи ответов. В качестве условий для экспериментов использовались данные от различных сенсоров, отражающих различные сценарии неисправности. Эксперименты проводились для сравнения одного LLM с несколькими LLMs, чтобы определить наилучшую конфигурацию для улучшения производительности диагностики. ## Результаты На основе проведенных экспериментов обнаружилось, что LLM-системы, использующие статистические описательные входные данные, показали лучшую точность и точность классификации неисправностей по сравнению с теми, которые используют сырые данные. Кроме того, системы с несколькими LLMs специализированными приглашениями (prompts) демонстрировали высшую точность и чувствительность к классам неисправностей по сравнению с одним LLM. Латентностью результатов является то, что LLM-системы могут создавать подробные и понятные для человека объяснения своих решений. Однако были выявлены ограничения, в частности, системы имеют сложности в адаптации к продолжительным циклам повторяющихся неисправностей. ## Значимость Полученные результаты указывают на возможности LLM-based фреймворков для диагностики неисправностей в индустрии. Они могут быть использованы в таких областях, как техническое обслуживание, промышленность и автоматизация. Из систем LLMs выделяются преимущества, такие как высокая точность, удобность в интерпретации результатов, а также возможность проведения анализа в реальном времени. Однако существуют ограничения в способности адаптироваться к изменениям в данных и в продолжительных

Annotation:

Large Language Model (LLM)-based systems present new opportunities for autonomous health monitoring in sensor-rich industrial environments. This study explores the potential of LLMs to detect and classify faults directly from sensor data, while producing inherently explainable outputs through natural language reasoning. We systematically evaluate how LLM-system architecture (single-LLM vs. multi-LLM), input representations (raw vs. descriptive statistics), and context window size affect diagnost...

ID: 2509.23113v1 cs.AI, cs.CY

arXiv PDF

📄 Toward Preference-aligned Large Language Models via Residual-based Model Steering

2025-10-01

Авторы:

Lucio La Cava, Andrea Tagarelli

## Контекст Одна из основных проблем с Large Language Models (LLMs) заключается в том, чтобы выравнять их беспристрастную продуктивность с целями и предпочтениями пользователей. Несмотря на то, что существуют методы, такие как Reinforcement Learning from Human Feedback (RLHF) и Direct Preference Optimization (DPO), эти подходы требуют больших объемов данных, дорогостоящей оптимизации и постоянной адаптации модели к конкретным задачам. Это приводит к значительным затратам времени и ресурсов. Для решения этой проблемы необходимо разработать метод, который бы становился более эффективным, гибким и менее дешевле, не требовал бы огромных вычислительных мощностей и мог бы использоваться в разных сценариях применения. ## Метод Метод, предложенный в работе, называется **Preference alignment of Large Language Models via Residual Steering (PaLRS)**, и является тренировочно-свободным подходом. Он использует "резидуальные потоки" (residual streams), отражающие динамику нелинейных связей в модели, для извлечения легких в использовании векторов управления. Такие векторы могут быть применены во время инференса, чтобы направить модель на поведение, соответствующее предпочтениям пользователя. Метод требует сравнительно малого количества примеров (например, одного из сто до пользовательских предпочтений) для создания этих векторов управления. Это позволяет подстраивать модель под задачи и пользовательские требования без необходимости снова тренировать модель, а также обеспечивает высокую эффективность и гибкость. ## Результаты Авторы проверили PaLRS на различных опен-сорсных LLMs, включая модели малого и среднего масштаба. На бенчмарк-задачах, таких как математическое разумание и генерация кода, модели с PaLRS-встраиваемыми векторами управления показали значительные улучшения в производительности. Эти модели сохранили свои общие качественные показатели, такие как гибкость и базовые функциональные возможности, не потеряв в общей точности и галости. Кроме того, PaLRS показала значительные экономии времени и ресурсов по сравнению с Direct Preference Optimization (DPO), в то же время оставаясь более эффективной и перспективной альтернативой. ## Значимость Предлагаемый подход имеет широкие применения в области адаптации LLMs к пользовательским предпочтениям. Он может использоваться в сферах, где требуется высокая гибкость и эффективность в настройке моделей на особые задачи (например, генерация кода, медицинские задачи, специализированные задачи технического письма). Одним из преимуществ PaLRS является его тренировочно-свободный характер, который позволяет избежать времязатратных и ресурсоемких процессов оптимизации. Благодаря этому, PaLRS может быть широко использован в сценариях, где не

Annotation:

Preference alignment is a critical step in making Large Language Models (LLMs) useful and aligned with (human) preferences. Existing approaches such as Reinforcement Learning from Human Feedback or Direct Preference Optimization typically require curated data and expensive optimization over billions of parameters, and eventually lead to persistent task-specific models. In this work, we introduce Preference alignment of Large Language Models via Residual Steering (PaLRS), a training-free method t...

ID: 2509.23982v1 cs.CL, cs.AI, cs.CY, cs.LG, cs.NE

arXiv PDF

Показано 111 - 120 из 208 записей