📊 Статистика дайджестов

Всего дайджестов: 34123 Добавлено сегодня: 101

Последнее обновление: сегодня

📄 HGTS-Former: Hierarchical HyperGraph Transformer for Multivariate Time Series Analysis

2025-08-09

Авторы:

Xiao Wang, Hao Si, Fan Zhang, Xiaoya Zhou, Dengdi Sun, Wanli Lyu, Qingquan Yang, Jin Tang

Анализ многомерных временных рядов — относительно сложная задача в AI, в связи с высокой размерностью, динамичностью и сложными взаимосвязями в данных. Для решения этой проблемы предлагается HGTS-Former, новая архитектура на основе гиперграфов и трансформеров, которая эффективно моделирует взаимосвязи между переменными в временных рядах. Алгоритм включает эмбеддинг каждого патча в токены, многоголосую самоповторяющуюся аттенцию для усиления временных паттернов и иерархические гиперграфы для агрегирования локальных характеристик и выявления зависимостей между переменными. Особенностью архитектуры является модуль EdgeToNode, который превращает гиперребра в вершины, улучшая выходные признаки. Эксперименты на двух задачах и восьми датасетах подтвердили высокую эффективность HGTS-Former в анализе многомерных временных рядов, демонстрируя его применимость и релевантность в этой области.

Annotation:

Multivariate time series analysis has long been one of the key research topics in the field of artificial intelligence. However, analyzing complex time series data remains a challenging and unresolved problem due to its high dimensionality, dynamic nature, and complex interactions among variables. Inspired by the strong structural modeling capability of hypergraphs, this paper proposes a novel hypergraph-based time series transformer backbone network, termed HGTS-Former, to address the multivari...

ID: 2508.02411v1 cs.CV, cs.AI, cs.LG

arXiv PDF

📄 Emergence of Fair Leaders via Mediators in Multi-Agent Reinforcement Learning

2025-08-09

Авторы:

Akshay Dodwadmath, Setareh Maghsudi

Задача установления справедливых лидеров в средах с множеством агентов, активно обсуждается в мультиагентном расширенном рейнфорсментном обучении (MARL). Традиционные Stackelberg-игры предполагают, что каждый этап игры заключается в действиях лидера, после чего следуют реакции слейвов. Однако выбор лидера может привести к несправедливости в ситуациях, где роль лидера и слейва меняется. Авторы показали, что установление лидера исходя из автоматического выделения лидера может привести к несправедливости в результатах. Для решения этой проблемы предложено интегрировать медиаторов (mediators) в среду мультиагентного лидер-слейв-мультиагентного расширенного рейнфорсментного обучения. Медиаторы могут управлять процессом действий лидеров в лидер-слейв-ситуации, где лидер выбирается на основе максимального уровня справедливости. Это решение позволяет максимизировать справедливость вознаграждений всех агентов, что приводит к справедливым результатам в целом.

Annotation:

Stackelberg games and their resulting equilibria have received increasing attention in the multi-agent reinforcement learning literature. Each stage of a traditional Stackelberg game involves a leader(s) acting first, followed by the followers. In situations where the roles of leader(s) and followers can be interchanged, the designated role can have considerable advantages, for example, in first-mover advantage settings. Then the question arises: Who should be the leader and when? A bias in the ...

ID: 2508.02421v1 cs.MA, cs.AI, cs.LG

arXiv PDF

📄 Multi-Class Human/Object Detection on Robot Manipulators using Proprioceptive Sensing

2025-08-09

Авторы:

Justin Hehli, Marco Heiniger, Maryam Rezayati, Hans Wernher van de Venn

**Резюме** В работах по физической коллаборации роботов с людьми (pHRC) важным аспектом является детекция контактов человека с объектами для обеспечения безопасности и эффективности работы. Эта работа предлагает расширение методов бинарной детекции (мягких и твердых объектов) на трехклассовую детекцию. Набор данных, собранный с помощью робота Franka Emika Panda, был использован для тренировки моделей на основе LSTM, GRU и Transformer. Метод скользящего окна (sliding window) оказался оптимальным для предварительной обработки временных рядов. Лучшая модель показала долю правильных ответов 91,11% при реальном временном тестировании, подтвердив возможность применения трехклассовой детекции в pHRC. Эта работа открывает путь к более точной интерпретации контактных ситуаций и улучшению задач коллаборации.

Annotation:

In physical human-robot collaboration (pHRC) settings, humans and robots collaborate directly in shared environments. Robots must analyze interactions with objects to ensure safety and facilitate meaningful workflows. One critical aspect is human/object detection, where the contacted object is identified. Past research introduced binary machine learning classifiers to distinguish between soft and hard objects. This study improves upon those results by evaluating three-class human/object detectio...

ID: 2508.02425v1 cs.RO, cs.AI

arXiv PDF

📄 FlashCommunication V2: Bit Splitting and Spike Reserving for Any Bit Communication

2025-08-09

Авторы:

Qingyuan Li, Bo Zhang, Hui Kang, Tianhao Xu, Yulei Qian, Yuchen Xie, Lin Ma

#### Аннотация В последнее время появилась критическая проблема в распределенной обучении и развертывании больших языковых моделей (LLM): блокировки в обмене данными. FlashCommunication V2 предлагает новую парадигму для эффективного передачи данных между GPU-устройствами при любых битовых разрядах. Решение основывается на двух новых подходах: бит-разделении и зарезервировании изменчивых значений (spike reserving). Бит-разделение декомпозирует нестандартные разряды в базовые единицы, что обеспечивает совместимость с хардваром и позволяет передавать данные в любых битовых разрядах. Зарезервирование изменчивых значений сохраняет крайние значения (минимумы и максимумы) в виде чисел с плавающей точкой, уменьшая динамический диапазон чисел и позволяя достичь работы с 2-битным сжатием при приемлемых потерях. Эта модель значительно повышает гибкость и эффективность использования ресурсов в системах коммуникации. Тщательное сочетание программного и аппаратного конструирования позволило достичь высокой производительности и снижения накладных расходов на NVLink- и PCIe-архитектурах, получив до 3.2$\times$ ускорения в AllReduce и 2$\times$ в All2All-передачах.

Annotation:

Nowadays, communication bottlenecks have emerged as a critical challenge in the distributed training and deployment of large language models (LLMs). This paper introduces FlashCommunication V2, a novel communication paradigm enabling efficient cross-GPU transmission at arbitrary bit widths. Its core innovations lie in the proposed bit splitting and spike reserving techniques, which address the challenges of low-bit quantization. Bit splitting decomposes irregular bit widths into basic units, ens...

ID: 2508.03760v1 cs.DC, cs.AI

arXiv PDF

📄 CABENCH: Benchmarking Composable AI for Solving Complex Tasks through Composing Ready-to-Use Models

2025-08-09

Авторы:

Tung-Thuy Pham, Duy-Quan Luong, Minh-Quan Duong, Trung-Hieu Nguyen, Thu-Trang Nguyen, Son Nguyen, Hieu Dinh Vo

Задача создания композируемых решений в AI, основанных на готовых моделях, является важной, но еще недооцененной областью исследований. Одной из основных проблем является отсутствие систематических подходов для оценки таких решений. В статье представлено CABENCH — первый открытый бенчмарк, состоящий из 70 реалистичных задач для композитного AI, а также пула 700 готовых моделей, покрывающих различные модальности и домены. Для поддержки исследований CABENCH включает оценочный фреймворк для полного анализа решений. Работа также предлагает ручные решения для сравнения с LLM-подходами, показав быстроту развития композитного AI, но также выявляя необходимость развития методов для автоматического генерирования эффективных композиций моделей. Это способствует решению реальных задач и иллюстрирует потенциал композитного AI.

Annotation:

Composable AI offers a scalable and effective paradigm for tackling complex AI tasks by decomposing them into sub-tasks and solving each sub-task using ready-to-use well-trained models. However, systematically evaluating methods under this setting remains largely unexplored. In this paper, we introduce CABENCH, the first public benchmark comprising 70 realistic composable AI tasks, along with a curated pool of 700 models across multiple modalities and domains. We also propose an evaluation frame...

ID: 2508.02427v1 cs.AI, cs.SE

arXiv PDF

📄 Multimodal Large Language Models for End-to-End Affective Computing: Benchmarking and Boosting with Generative Knowledge Prompting

2025-08-09

Авторы:

Miaosen Luo, Jiesen Long, Zequn Li, Yunying Yang, Yuncheng Jiang, Sijie Mai

**Резюме** В статье представлено изучение multimodal large language models (MLLMs) для задач multimodal affective computing (MAC). Эти модели объединяют различные модальности (текст, видео, аудио) в единой структуре для распознавания и интерпретации человеческих эмоций. Однако существуют проблемы: непостоянство результатов в зависимости от типа задачи и неоднозначность влияния архитектурных решений и характеристик данных на качество анализа эмоций. Авторы провели систематическую оценку современных MLLMs на различных MAC-данных, показали, как модели отличаются в плане качества и подвергли анализу условий, при которых это происходит. Также предложена новая стратегия, комбинирующая generative knowledge prompting с supervised fine-tuning. Эксперименты показали, что такой подход значительно повышает эффективность моделей в решении MAC-задач, делая его простой и эффективной для последующих исследований в этой области.

Annotation:

Multimodal Affective Computing (MAC) aims to recognize and interpret human emotions by integrating information from diverse modalities such as text, video, and audio. Recent advancements in Multimodal Large Language Models (MLLMs) have significantly reshaped the landscape of MAC by offering a unified framework for processing and aligning cross-modal information. However, practical challenges remain, including performance variability across complex MAC tasks and insufficient understanding of how ...

ID: 2508.02429v1 cs.AI, cs.LG

arXiv PDF

📄 Assessing the Reliability and Validity of Large Language Models for Automated Assessment of Student Essays in Higher Education

2025-08-09

Авторы:

Andrea Gaggioli, Giuseppe Casaburi, Leonardo Ercolani, Francesco Collova', Pietro Torre, Fabrizio Davide

**Резюме** В статье анализируется надежность и достоверность пяти современных текстовых генеративных моделей (LLMs) — Claude 3.5, DeepSeek v2, Gemini 2.5, GPT-4 и Mistral 24B — при оценке студенческих эссе в высшем образовании. Исследование основывается на оценке 67 итальяноязычных эссе по психологии, используя четырёхкритерийный рейтинг (Подходящесть, Здравость, Оригинальность, Реализуемость). Наблюдаются существенные расхождения между оценками моделей и человеком, в том числе непостоянные результаты оценивания Здравости и Феасибильности. Кроме того, выявлена склонность к надуву рейтинга Здравости и непостоянность в работе с контекстуальными факторами. Людско-модельный согласий (Quadratic Weighted Kappa) оказался незначительным, а внутримодельная стабильность (Kendall's W) — ниже 0.30. На основе этих результатов следует, что текущие LLMs ограничены в способности делать контекстуально обоснованные оценки и воспроизводить гуманное жизнерадостное суждение в задачах, требующих глубинного дисциплинарного понимания. Человеческое управление остается критически важным при автоматизированных оценках, особенно в сложных интерпретируемых задачах.

Annotation:

This study investigates the reliability and validity of five advanced Large Language Models (LLMs), Claude 3.5, DeepSeek v2, Gemini 2.5, GPT-4, and Mistral 24B, for automated essay scoring in a real world higher education context. A total of 67 Italian-language student essays, written as part of a university psychology course, were evaluated using a four-criterion rubric (Pertinence, Coherence, Originality, Feasibility). Each model scored all essays across three prompt replications to assess int...

ID: 2508.02442v1 cs.CY, cs.AI

arXiv PDF

📄 Dynamic Forgetting and Spatio-Temporal Periodic Interest Modeling for Local-Life Service Recommendation

2025-08-09

Авторы:

Zhaoyu Hu, Hao Guo, Yuan Tian, Erpeng Xue, Jianyang Wang, Xianyang Qi, Hongxiang Lin, Lei Wang, Sheng Chen

На популярных платформах локальных услуг сталкиваются с проблемой правильного моделирования поведения пользователей в условиях сильной специфичности местности и сильной специальной зависимости. Рекомендательные системы сталкиваются с недостатком длинных поведенческих последовательностей и сильной специальной зависимостью времени и места. Данная работа предлагает метод Spatio-Temporal Periodic Interest Modeling (STIM), который использует идею динамического забывания, аналогичной человеческой памяти. STIM включает в себя модуль динамического маскирования, основанный на кривой забывания, для извлечения резких и периодических спато-временных признаков. Он также включает в себя метод смеси экспертов (MoE), который адаптивно активирует экспертные сети для моделирования времени, места и предметов, а также многоинтересовой сети, которая позволяет охватывать различные интересы пользователей. Оценивая этот подход в реальных условиях, были получены улучшения в производительности системы, включая повышение объема транзакций на 1,54%. STIM был развернут в большой рекомендательной системе и сейчас используется для работы с миллионами пользователей.

Annotation:

In the context of the booming digital economy, recommendation systems, as a key link connecting users and numerous services, face challenges in modeling user behavior sequences on local-life service platforms, including the sparsity of long sequences and strong spatio-temporal dependence. Such challenges can be addressed by drawing an analogy to the forgetting process in human memory. This is because users' responses to recommended content follow the recency effect and the cyclicality of memory....

ID: 2508.02451v1 cs.IR, cs.AI

arXiv PDF

📄 TreeRanker: Fast and Model-agnostic Ranking System for Code Suggestions in IDEs

2025-08-09

Авторы:

Daniele Cipollone, Egor Bogomolov, Arie van Deursen, Maliheh Izadi

Наиболее важная функция современных интегрированных сред разработки (IDE) — токен-уровневая комплиционка, которая предлагает разработчикам актуальные идентификаторы и API во время написания кода. Хотя предложения формируются с помощью статического анализа, их полезность определяется порядком их отображения. Многие нынешние системы полагаются на ручную инженерию или легкие модели машинного обучения, основанные на пользовательских логах, что ограничивает их общую наглядность и интеллектуальность. В этой работе предложен новый подход к оценке статических комплиционок с помощью языковых моделей, реализованный в модели TreeRanker. Он организует все возможные комплиционы в префиксное дерево и выполняет один проход жадного декодирования для вычисления токен-уровневых оценок. Это позволяет достичь точного токен-уровневого ранжирования без необходимости использовать биржу поиска, манипуляции с запросами или адаптации моделей. Метод является быстрым, архитектурно независимым и взаимодействует с уже развернутыми моделями для комплиционок. Эти результаты показывают практичность и эффективность интеграции языковых моделей в существующие средства IDE, для повышения точности и отзывчивости рекомендаций.

Annotation:

Token-level code completion is one of the most critical features in modern Integrated Development Environments (IDEs). It assists developers by suggesting relevant identifiers and APIs during coding. While completions are typically derived from static analysis, their usefulness depends heavily on how they are ranked, as correct predictions buried deep in the list are rarely seen by users. Most current systems rely on hand-crafted heuristics or lightweight machine learning models trained on user ...

ID: 2508.02455v1 cs.SE, cs.AI, cs.IR

arXiv PDF

📄 AIAP: A No-Code Workflow Builder for Non-Experts with Natural Language and Multi-Agent Collaboration

2025-08-09

Авторы:

Hyunjn An, Yongwon Kim, Wonduk Seo, Joonil Park, Daye Kang, Changhoon Oh, Dokyun Kim, Seunghyun Lee

**Резюме** Возникновение AIAP (AI Assistance Platform) ставится перед проблемой непосредственного взаимодействия между неэкспертными пользователями и сложными системами AI. Несмотря на многочисленные инструменты для проектирования AI, неэкспертные пользователи часто сталкиваются с трудностями в конкретном выражении своей интенции и управлении сложностью системы. Исследование показывает, что AIAP — это новое, нетехническое решение, которое использует ввод в естественной речи и визуальные рабочие процессы, объединенные с системой многоагентного взаимодействия. AIAP декомпозирует неясные пользовательские инструкции в модульные, действительные шаги, недоступные для пользователя, но управляемые через прозрачный интерфейс. Исследование с 32 участниками демонстрирует, что AIAP's АI-генерируемые рекомендации, модульные рабочие процессы и автоматическое определение данных, действий и контекста значительно упрощают процесс создания AI-сервисов, делая его более интуитивным. Эти результаты подтверждают, что новый подход, основанный на естественной речи и визуальном программировании, значительно снижает барьеры для неэкспертных пользователей и повышает их удобство при проектировании AI-сервисов.

Annotation:

While many tools are available for designing AI, non-experts still face challenges in clearly expressing their intent and managing system complexity. We introduce AIAP, a no-code platform that integrates natural language input with visual workflows. AIAP leverages a coordinated multi-agent system to decompose ambiguous user instructions into modular, actionable steps, hidden from users behind a unified interface. A user study involving 32 participants showed that AIAP's AI-generated suggestions,...

ID: 2508.02470v1 cs.HC, cs.AI, cs.CL, cs.MA, cs.SE

arXiv PDF

1
2
3361
3362
3363
3364
3365
3412
3413

Показано 33621 - 33630 из 34123 записей