📊 Статистика дайджестов

Всего дайджестов: 34123 Добавлено сегодня: 101

Последнее обновление: сегодня
Авторы:

Kristin M. Kostick-Quenet, Meghan E. Hurley, Syed Ayaz, John Herrington, Casey Zampella, Julia Parish-Morris, Birkan Tunç, Gabriel Lázaro-Muñoz, J. S. Blumenthal-Barby, Eric A. Storch

**Резюме** В статье рассматриваются перспективы использования компьютерных технологий персонализации здравоохранения, включая дигитальные фенотипы, эффективный вычислительный анализ и пассивные методы сенсоринга. Хотя эти технологии обещают улучшить качество здравоохранения, они вызывают затруднения по поводу приватности, устойчивости к предрассудкам и риска редукционизма. Авторы проводили квалитиативное исследование, проведя интервью с 102 участниками, включая пациентов, их родителей, медиков, разработчиков и этичных специалистов. Они выявили семь ключевых областей озабоченности: доверие к данным, ценность для пациента, реализацию в рабочих процессах, регулирование, приватность, прямые и косвенные вреды, а также критика редукционизма. Рекомендовано использовать "личные маршруты" — кооперативно созданные планы, которые определяют сбор данных, обработку, способы обратной связи и меры клинического действия. Данный подход может стать фундаментом для создания баланса между персонализацией здравоохранения и сохранением ценностей гуманистического подхода.
Annotation:
Computer perception (CP) technologies (digital phenotyping, affective computing and related passive sensing approaches) offer unprecedented opportunities to personalize healthcare, but provoke concerns about privacy, bias and the erosion of empathic, relationship-centered practice. A comprehensive understanding of perceived risks, benefits, and implementation challenges from those who design, deploy and experience these tools in real-world settings remains elusive. This study provides the first ...
ID: 2508.02550v1 cs.HC, cs.AI, cs.CY
Авторы:

Javier Fumanal-Idocin, Raquel Fernandez-Peralta, Javier Andreu-Perez

В современных классификационных задачах часто возникает потребность в прозрачности и уточнении принятых решений, особенно в критичных сферах, таких как медицина. Динамическая селекция признаков (DFS) позволяет адаптировать выбор признаков к каждому отдельному случаю, обеспечивая более гибкий и интуитивный подход по сравнению с традиционными статическими методами. Тем не менее, многие DFS-решения оперируют скрытыми моделями, что снижает их значимость в реальных применениях. В данной работе предлагается новая DFS-методика, основанная на правильной системе, что обеспечивает более понятный для пользователя процесс принятия решений. Метод также дает возможность оценивать неопределенность на каждом этапе выбора признаков и сокращает вычислительные затраты за счет ограничения поискового пространства. Авторы показали, что их подход демонстрирует соревновательную производительность по сравнению с градиентными и глубокоучитывающими методами, являющимися более непрозрачными. Это делает DFS-систему правильной более пригодной для использования в реальной жизни, особенно где прозрачность критична.
Annotation:
Dynamic feature selection (DFS) offers a compelling alternative to traditional, static feature selection by adapting the selected features to each individual sample. Unlike classical methods that apply a uniform feature set, DFS customizes feature selection per sample, providing insight into the decision-making process for each case. DFS is especially significant in settings where decision transparency is key, i.e., clinical decisions; however, existing methods use opaque models, which hinder th...
ID: 2508.02566v1 cs.LG, cs.AI
Авторы:

Eman Alamoudi, Ellis Solaiman

**Резюме** В статье представлена EHSAN, первая гибридная модель для арабского аспект-базированного мнения в сфере здравоохранения. Арабский язык представляет сложности из-за богатого диалектного разнообразия и недостатка меток аспектного мнения. Разработанная модель EHSAN объединяет машинное обучение с глубоким представлением языка ChatGPT и целенаправленным корректированием человеческим рецензентом, чтобы создать полностью новый языковой ресурс в области здравоохранения. Эта модель обучена на трёх версиях данных: полностью аннотированных человеком, частично аннотированных человеком и полностью подготовленных ChatGPT. Эксперименты показали, что даже с минимальными ручными корректировками модель достигает высокой точности. Меньшее количество классов аспектов также улучшало результаты. Результаты указывают на простоту и эффективность гибридного подхода в создании семантических моделей для арабского языка в здравоохранении. Будущие работы будут направлены на улучшение модели пространством применения и наращивании транспарентности.
Annotation:
Arabic-language patient feedback remains under-analysed because dialect diversity and scarce aspect-level sentiment labels hinder automated assessment. To address this gap, we introduce EHSAN, a data-centric hybrid pipeline that merges ChatGPT pseudo-labelling with targeted human review to build the first explainable Arabic aspect-based sentiment dataset for healthcare. Each sentence is annotated with an aspect and sentiment label (positive, negative, or neutral), forming a pioneering Arabic dat...
ID: 2508.02574v1 cs.CL, cs.AI, cs.LG, cs.SI
Авторы:

Lei Zan, Keli Zhang, Ruichu Cai, Lujia Pan

**Резюме** Несмотря на выдающиеся результаты во многих областях, Large Language Models (LLMs) сталкиваются с трудностями при выполнении задач, требующих сложного математического рассуждения. Это ограничение возникает из-за проблем с глубокой структурной зависимостью и недостатком явной структуры в процессе вывода. В статье предлагается **CAMA** (Causal Mathematician) — двухэтапная модель, которая внедряет в LLMs исчерпывающую структуру математической логики. В первой стадии CAMA строит **Mathematical Causal Graph (MCG)**, аккумулируя ключевую информацию из расширенного набора задач с решениями. Этот граф описывает зависимости между знаниями и их причинно-следственными отношениями. Во второй стадии CAMA адаптирует MCG к конкретной задаче, используя выбранные примеры для дополнительной оптимизации. Результаты экспериментов показали, что CAMA улучшает производительность LLMs на задачах математического анализа, демонстрируя преимущество структурированного подхода над неструктурированным. Также оказалось, что учёт ассимметричных связей в графе способствует более существенным улучшениям по сравнению с использованием только симметричных связей.
Annotation:
Large Language Models (LLMs) have demonstrated strong performance across a wide range of tasks, yet they still struggle with complex mathematical reasoning, a challenge fundamentally rooted in deep structural dependencies. To address this challenge, we propose \textbf{CA}usal \textbf{MA}thematician (\textbf{CAMA}), a two-stage causal framework that equips LLMs with explicit, reusable mathematical structure. In the learning stage, CAMA first constructs the \textbf{M}athematical \textbf{C}ausal \t...
ID: 2508.02583v2 cs.AI, cs.LG
Авторы:

Ming Pok Ng, Junqi Jiang, Gabriel Freedman, Antonio Rago, Francesca Toni

Настоящая работа предлагает MArgE, новую архитектуру для объединения выводов нескольких больших языковых моделей (LLM) при выполнении задачи проверки утверждений. Основная проблема заключается в том, что нынешние методы комбинации выводов нескольких LLMs часто основываются на неструктурированных интеракциях (например, свободных дебатах), что приводит к недостоверной и незащищаемой окончательной ответной модели. Разработанная архитектура MArgE использует ArgLLMs для построения структурированных деревьев аргументов для каждого LLM, чтобы обеспечить прозрачную и доказуемую логику вывода. Экспериментальные исследования показали, что MArgE превосходит открытые LLM модели, включая GPT-4o-mini, а также другие методы для решения этой задачи, демонстрируя преимущество формальных методов аргументированного рассуждения при объединении выводов нескольких LLM.
Annotation:
Leveraging outputs from multiple large language models (LLMs) is emerging as a method for harnessing their power across a wide range of tasks while mitigating their capacity for making errors, e.g., hallucinations. However, current approaches to combining insights from multiple LLMs often involve unstructured interactions (e.g., free debate), resulting in model generations that are not faithfully justifiable. In this work, we introduce MArgE, a novel framework to provide formal structure to the ...
ID: 2508.02584v1 cs.CL, cs.AI
Авторы:

Yilun Liu, Yunpu Ma, Yuetian Lu, Shuo Chen, Zifeng Ding, Volker Tresp

Многоэкспертные модели (MoE) используют динамический механизм маршрутизации для распределения задач между специализированными экспертами, что позволяет эффективно оптимизировать их обучение и использование. Однако существующие стратегии Parameter-Efficient Fine-Tuning (PEFT) не учитывают этот аспект, что приводит к потерям в эффективности. В статье рассматривается вопрос о том, должны ли модули подготовки включать в себя механизмы маршрутизации, чтобы лучше адаптироваться к архитектуре MoE. Описывается анализ динамики PEFT при использовании в моделях MoE и изучаются различные стратегии маршрутизации. Исследования проводились на моделях OLMoE-1B-7B и Mixtral-8x7B, адаптированных к задачам смыслового понимания и математического рассуждения. На основе экспериментов доказано, что маршрутизируемые модули позволяют достичь более высокой эффективности и точности. На основе этих результатов даны рекомендации по оптимальной конфигурации для различных сценариев и применения MoE в реальных задачах.
Annotation:
Mixture-of-Experts (MoE) benefits from a dynamic routing mechanism among their specialized experts, which existing Parameter- Efficient Fine-Tuning (PEFT) strategies fail to leverage. This motivates us to investigate whether adaptation modules themselves should incorporate routing mechanisms to align with MoE's multi-expert architecture. We analyze dynamics of core components when applying PEFT to MoE language models and examine how different routing strategies affect adaptation effectiveness. E...
ID: 2508.02587v1 cs.LG, cs.AI, cs.CL
Авторы:

Catalina Gomez, Lalithkumar Seenivasan, Xinrui Zou, Jeewoo Yoon, Sirui Chu, Ariel Leong, Patrick Kramer, Yu-Chun Ku, Jose L. Porras, Alejandro Martin-Gomez, Masaru Ishii, Mathias Unberath

Ограниченный доступ к экспертному фидбэку ограничивает эффективность обучения самостоятельно. Авторы предлагают использовать explainable AI (XAI) для автоматического анализа видео и формирования пользовательских фидбэков в симуляционном обучении хирургических навыков. Методом компаративного сравнения субъективного и автоматического фидбэка показано, что XAI повышает уровень конфиденциальности и уменьшает нагрузку на студентов. Хотя XAI не пошагово улучшило навыки по сравнению с традиционными методами, работа раскрывает потенциал адаптивных инструментов для однородного и структурированного обучения, перспективу для трансформации обучения с помощью AI.
Annotation:
Traditional surgical skill acquisition relies heavily on expert feedback, yet direct access is limited by faculty availability and variability in subjective assessments. While trainees can practice independently, the lack of personalized, objective, and quantitative feedback reduces the effectiveness of self-directed learning. Recent advances in computer vision and machine learning have enabled automated surgical skill assessment, demonstrating the feasibility of automatic competency evaluation....
ID: 2508.02593v1 cs.HC, cs.AI
Авторы:

Siyi Liu, Yujia Zheng, Yongqi Zhang

**Резюме** В области машинного обучения применение методов к табулярным данным сталкивается с ограничением данных, что снижает эффективность моделей. Хотя генерирующие модели могут устранить эту проблему, они часто не учитывают структуру табличных данных в узких данных, что приводит к низкокачественным синтетическим данным. Мы предлагаем StructSynth, новую рамочную архитектуру, которая комбинирует мощь Лангуажных Моделей (LLM) с определенным управлением структурой. Она включает два этапа: обнаружение структуры с использованием графа типа DAG из доступных данных и использование этой структуры для управления процессом генерации LLM. Это позволяет гарантировать, что генерируемые данные сохраняют логику зависимостей между признаками. Наши эксперименты показали, что StructSynth выдает синтетические данные с более высокой структурной точностью и удовлетворяющими целям уменьшения рисков при разглашении. Это делает её привлекательной для сложных сценариев с низким объёмом данных.
Annotation:
The application of machine learning on tabular data in specialized domains is severely limited by data scarcity. While generative models offer a solution, traditional methods falter in low-data regimes, and recent Large Language Models (LLMs) often ignore the explicit dependency structure of tabular data, leading to low-fidelity synthetics. To address these limitations, we introduce StructSynth, a novel framework that integrates the generative power of LLMs with robust structural control. Struct...
ID: 2508.02601v1 cs.LG, cs.AI
Авторы:

Jiayin Jin, Zhimeng Pan, Yang Tang, Jiarui Feng, Kungang Li, Chongyuan Xiang, Jiacheng Li, Runze Su, Siping Ji, Han Sun, Ling Leng, Prathibha Deshikachar

В статье предлагается метод улучшения обучения представлений сущностей для рекламных моделей, ориентированных на оптимизацию CTR и CVR в Pinterest Ads. Основная проблема заключается в том, что существующие модели неэффективно интегрируют знания из графа, состоящего из onsite и offsite активностей пользователей. Разработанное решение включает в себя построение крупномасштабного графа, сочетающего onsite-обращения пользователей в рекламных кампаниях и offsite-конверсии. Для эффективного обработки этого графа предложен TransRA, усовершенствованная модель Knowledge Graph Embedding (KGE), которая активно использует аттестационные механизмы для объединения эмбеддингов в рекомендательную модель. Чтобы повысить пользу от KGE в реальных задачах рекламного ориентированного ранжирования, введены техники Large ID Embedding Table и fine-tuning KGE. Эксперименты показали повышение AUC в CTR и CVR на 2.69% и 1.34% соответственно, а также сокращение CPC. Эти технологии могут быть использованы для улучшения моделей в других индустриальных системах рекомендаций.
Annotation:
Graph Neural Networks (GNN) have been extensively applied to industry recommendation systems, as seen in models like GraphSage\cite{GraphSage}, TwHIM\cite{TwHIM}, LiGNN\cite{LiGNN} etc. In these works, graphs were constructed based on users' activities on the platforms, and various graph models were developed to effectively learn node embeddings. In addition to users' onsite activities, their offsite conversions are crucial for Ads models to capture their shopping interest. To better leverage of...
ID: 2508.02609v2 cs.LG, cs.AI, cs.SE
Авторы:

Vali Tawosi, Salwa Alamir, Xiaomo Liu, Manuela Veloso

В поиске эффективных способов автоматизации разработки программного обеспечения, особой сложностью представляется баг-локализация в больших и сложных кодовых базах. Для решения этой проблемы предложено решение Meta-RAG, основанное на методе Retrieval Augmented Generation (RAG), которое объединяет информационное восстановление и генеративные модели языка на основе ведущих LLMs. Основная идея заключается в создании компактного, структурированного представления кодовой базы в виде естественного языка (суммарно получается примерно 20% оригинального кода), а затем использовании генеративной модели для определения критических частей кода, связанных с багом. Экспериментальные результаты показали, что Meta-RAG достигает высокой точности баг-локализации — 84,67% на уровне файлов и 53% на уровне функций, — превосходя таким образом подходы за счет интеллектуальной обработки и сжатия кода.
Annotation:
Large Language Model (LLM) systems have been at the forefront of applied Artificial Intelligence (AI) research in a multitude of domains. One such domain is software development, where researchers have pushed the automation of a number of code tasks through LLM agents. Software development is a complex ecosystem, that stretches far beyond code implementation and well into the realm of code maintenance. In this paper, we propose a multi-agent system to localize bugs in large pre-existing codebase...
ID: 2508.02611v1 cs.SE, cs.AI
Показано 33641 - 33650 из 34123 записей