📊 Статистика дайджестов
Всего дайджестов: 34022 Добавлено сегодня: 82
Последнее обновление: сегодня
Авторы:
Rodrigo Tertulino
## Контекст
Современные высшие учебные заведения сталкиваются с острой проблемой высоких отставаний и отказов в дистанционном обучении. Эти явления не только сказываются на уровне формирования общих академических результатов, но и сильно повлияют на индивидуальный успех студентов. Одним из ключевых подходов к решению этой проблемы является раннее идентифицирование рискованных студентов. Это позволит институтам предоставить необходимую поддержку в самый ранний срок. Однако развитие таких систем сталкивается с несколькими вызовами, включая защиту персональных данных и изоляцию данных между учреждениями. Исследование сосредоточено на использовании методов машинного обучения для решения этих проблем, при этом применение Federated Learning (FL) позволяет создать модели, которые одновременно обеспечивают эффективность и соблюдают необходимую конфиденциальность.
## Метод
Для разработки модели использовалась база данных OULAD, которая содержит разнообразные аспекты учебного процесса и цифровых взаимодействий студентов. Для формирования базовой модели, анализирующей риск выпадения, использовались два типа моделей: Logistic Regression (LR) и Deep Neural Network (DNN). Для гарантии конфиденциальности данных и масштабируемости решения реализовали федеративное обучение (Federated Learning), в котором модели обучались непосредственно на данных отдельных учреждений, не обрабатываясь в централизованном репозитории. Это позволило обеспечить безопасность данных, сохранив хорошую точность в предсказаниях.
## Результаты
Используя OULAD-датасет, проведен набор экспериментов с обеими моделями, Logistic Regression и DNN. Оба подхода были протестированы на различных уровнях сложности и методах балансировки данных. Благодаря FL-фреймворку, обучение проводилось на отдельных учебных заведениях, не раскрывая исходных данных. Результаты показали, что федеративная модель DNN демонстрирует высокую точность, с ROC AUC-скором 85% для прогнозирования риска отставания студентов. Это подтверждает мощь FL в решении проблем распределенного обучения, при этом учитывая конфиденциальность данных.
## Значимость
Результаты имеют практическое значение для многих учебных заведений, которым необходимы эффективные системы раннего предупреждения. Federated Learning позволяет интегрировать данные из нескольких источников без угрозы конфиденциальности, что делает это решение привлекательным для различных учреждений. Это может привести к повышению производительности студентов, снижению отставаний и замедлений в обучении. Модель также может быть применена в других областях, где требуется соблюдение конфиденциальности данных, например, в медицине или финансах.
Annotation:
High dropout and failure rates in distance education pose a significant
challenge for academic institutions, making the proactive identification of
at-risk students crucial for providing timely support. This study develops and
evaluates a machine learning model based on early academic performance and
digital engagement patterns from the large-scale OULAD dataset to predict
student risk at a UK university. To address the practical challenges of data
privacy and institutional silos that often hind...
Авторы:
Liu Liu, Rui Dai
#### Контекст
Предсказание и понимание успеваемости в математике являются ключевыми аспектами развития эффективных учебных программ и политик. Однако существуют значительные проблемы в том, как учесть контекстные факторы, такие как социально-экономическое положение, индивидуальные особенности учащихся и окружающую среду. Эти аспекты влияют на развитие стратегий, нацеленных на повышение уровня образовательного достижения. Особенно важной является задача разработки моделей, которые не только предупреждают результаты, но и обеспечивают прозрачность их построения.
#### Метод
Для решения этой задачи использовались методы explainable artificial intelligence (XAI) на основе PISA 2018 данных. Были разработаны и протестированы четыре модели: Multiple Linear Regression (MLR), Random Forest (RF), CATBoost и Artificial Neural Networks (ANN). Обучение проводилось на 70% данных с использованием 5-fold cross-validation, а тестирование — на 30%, разбитых по странам. Для оценки качества использовались R^2 и Mean Absolute Error (MAE). Для повышения прозрачности результатов применялись функции интерпретации, такие как feature importance, SHAP values и диаграммы деревьев решений.
#### Результаты
Нелинейные модели, в том числе RF и ANN, показали лучшие результаты по отношению к MLR, сочетая точность и общиезуемость. RF оказалась самой балансированной по модели. Главными факторами, влияющими на успеваемость, являлись социально-экономическое положение, время на изучение математики, мотивация учителей и активность учащихся в математике. Однако эти факторы воспринимались по-разному в разных странах. Метрики, такие как графики сравнения предсказанных и фактических результатов, подтвердили высокую точность RF и CATBoost.
#### Значимость
Результаты могут быть применены в различных областях, включая разработку национальных и международных учебных программ, создание персонализированных стратегий обучения и развитие системы равенства в образовании. Использование XAI позволяет повысить прозрачность и понимание факторов, определяющих успеваемость, что имеет значительное значение для разработки точных и эффективных мер по повышению качества образования.
#### Выводы
Исследование показало, что нелинейные модели, такие как RF и ANN, эффективно предсказывают успеваемость в математике, учитывая контекстные факторы. Направления будущих исследований будут направлены на расширение объемов данных, уточнение моделей и их применение в различных регионах. Объединение XAI и образовательных исследований может привести к новым разработкам в области равноправия и качества образования.
Annotation:
Understanding the factors that shape students' mathematics performance is
vital for designing effective educational policies. This study applies
explainable artificial intelligence (XAI) techniques to PISA 2018 data to
predict math achievement and identify key predictors across ten countries
(67,329 students). We tested four models: Multiple Linear Regression (MLR),
Random Forest (RF), CATBoost, and Artificial Neural Networks (ANN), using
student, family, and school variables. Models were traine...
Авторы:
Hanzhong Zhang, Muhua Huang, Jindong Wang
## Контекст
Общество современности становится все более цифровым, что приводит к расширению возможностей для моделирования человеческих социальных динамик. Развитие технологий, таких как Большие Лингвистические Модели (Big Language Models, BLM), позволило эффективно симулировать человеческие социальные поведения. Однако остается неясным, могут ли эти модели проявить стабильную способность формировать стойки и границы в комплексных социальных взаимодействиях, а также как они реагируют на человеческие вмешательства. Эти вопросы определили мотивацию для разработки исследовательского фреймворка, который исследует процессы группового стойкообразования и формирования границ в контексте человеко-агентных гибридных обществ.
## Метод
Фреймворк основывается на компьютерной модели многоагентных обществ, в которой используется генерирующая моделирование многоагентных систем (Generative Agent-Based Modeling, GABM) в сочетании с виртуальной этнографией. Агенты взаимодействуют в симуляционной среде с языковыми сетями, используя генерирующие технологии. Эта система позволяет исследовать процессы формирования стойков и границ в реалистичных условиях. Метод включает в себя симуляции взаимодействий, виртуальные эксперименты с участием человеков и агентов, а также оптимизацию параметров модели для достижения наиболее реалистичных результатов.
## Результаты
Исследования показали, что агенты формируют стойки независимо от их предварительно определенных идентитетов, активно используя язык для выражения отличий. Они демонстрируют индивидуальные тоновые предпочтения и реагируют на различные дискурсные стратегии, отталкиваясь от контекста. Было обнаружено, что агенты самоорганизовываются в сообщества, разрушая существующие идентитетно-ориентированные властные структуры и формируя новые границы на основе этих стойков. Эти результаты подтверждают, что искусственные агенты могут становиться активными участниками социальных динамик, демонстрируя гибкость в формировании социальных структур.
## Значимость
Найденные результаты имеют значительное значение для нескольких областей: моделирования социальных динамик, интеллектуальных интерфейсов, социальных систем и управления. Моделирование человеко-агентных гибридных обществ может способствовать пониманию социальных процессов, помочь в разработке более эффективных интеллектуальных систем, а также в построении моделей для управления социальными сетями. Этот подход открывает новые возможности для интеграции генерирующих технологий в исследования социальных динамик.
## Выводы
Исследование у
Annotation:
Large language models have been widely used to simulate credible human social
behaviors. However, it remains unclear whether these models can demonstrate
stable capacities for stance formation and identity negotiation in complex
interactions, as well as how they respond to human interventions. We propose a
computational multi-agent society experiment framework that integrates
generative agent-based modeling with virtual ethnographic methods to
investigate how group stance differentiation and soc...
Авторы:
Yiming Xu, Junfeng Jiao
## Контекст
Предсказание способа путешествия (travel mode choice) является ключевым фактором для эффективного транспортного планирования. Однако существующие статистические и машинное обучение (machine learning) модели страдают от редуцированной гибкости, ограниченной контекстной рассуждением и недостаточной общностью. В этом исследовании рассматривается возможность использования Large Language Models (LLMs), которые предлагают более гибкую и контекст-знающую модель для предсказания способа путешествия. Дополнительно, введена методология Retrieval-Augmented Generation (RAG), которая позволяет лучше интегрировать эмпирические данные в процесс предсказания. Исследование также исследует различные стратегии RAG для оптимизации процесса работы LLMs.
## Метод
Моделирование предсказаний о способах путешествия осуществляется с помощью LLMs, в которые внедрена RAG. Для подачи набора данных в модель используется модульный фреймворк, который позволяет сравнивать различные стратегии RAG. Используются четыре стратегии RAG: базовая RAG, RAG с балансировкой набора данных, RAG с кросс-энкодером для ре-ранкинга и RAG с балансировкой набора данных и кросс-энкодером для ре-ранкинга. Эти стратегии тестируются на трех различных моделях LLMs: OpenAI GPT-4o, o4-mini и o3. Для экспериментов использованы данные из 2023 Puget Sound Regional Household Travel Survey.
## Результаты
Эксперименты показали, что внедрение RAG значительно повышает точность предсказаний для всех моделей LLM. Наиболее эффективной была комбинация GPT-4o с балансировкой набора данных и кросс-энкодером для ре-ранкинга, которая достигла точности 80.8%. LLMs показали значительное преимущество в общей общей гибкости и точности по сравнению с статистическими и традиционными моделями машинного обучения.
## Значимость
Исследование демонстрирует значимость внедрения RAG в LLMs для предсказания способа путешествия. Результаты могут применяться в транспортном планировании и логистике для эффективного решения задач моделирования поведения. Данная модель также улучшает общую гибкость и точность моделей, что делает её более универсальной и полезной в разных сценариях.
## Выводы
Результаты показывают, что RAG значительно повышает точность предсказаний в LLMs для моделирования способа путешествия. Однако существует необходимость продолжать исследования для оптимизации стратегий RAG и их интеграции с LLMs, чтобы добиться наибольшего эффекта в моделировании поведения. Будущие исследования должны также сосредоточиться на расширении применения этой модели в различных транспортных сценариях.
Annotation:
Accurately predicting travel mode choice is essential for effective
transportation planning, yet traditional statistical and machine learning
models are constrained by rigid assumptions, limited contextual reasoning, and
reduced generalizability. This study explores the potential of Large Language
Models (LLMs) as a more flexible and context-aware approach to travel mode
choice prediction, enhanced by Retrieval-Augmented Generation (RAG) to ground
predictions in empirical data. We develop a modu...
📄 Leveraging Large Language Models for Accurate Sign Language Translation in Low-Resource Scenarios
2025-08-27Авторы:
Luana Bulla, Gabriele Tuccio, Misael Mongiovì, Aldo Gangemi
## Контекст
Необходимость создания доступных и инклюзивных технологий для людей с ограниченными возможностями является ключевой задачей в современной информатике. Одним из самых вызовов является перевод естественных языков на жестовые языки. Изучение этой задачи важно для улучшения общения между людьми со сверхурочной интонацией и лицами с ограниченным слухом. Однако существуют существенные проблемы в этой области. Ограниченность доступных данных, высокая специфичность, нестандартизированность и недостаточное представление языка на сигнализацию приводят к проблемам в развитии эффективных методов. Текущие методы часто не могут обеспечить широкое применение, поскольку они слишком ограничены в данных и не могут обеспечить обобщение в сложных и нестандартных ситуациях. Наша мотивация заключается в разработке метода, который может решать эти проблемы, увеличивая доступность и эффективность технологий для перевода естественных языков на жестовые языки.
## Метод
Мы предлагаем метод Advanced Use of LLMs for Sign Language Translation (AulSign), который использует технологию бо LLM для обработки естественных языков и перевода на жесты. Метод называется Advanced Use of LLMs for Sign Language Translation (AulSign). Основная особенность метода заключается в том, что мы используем динамическую подсказку (dynamic prompting) и обучение контекстом (in-context learning), чтобы обеспечить эффективную обработку языка и перевод на жесты. Мы объединяем LLM с компактными описаниями жестов в естественной речи и обучаем модель, чтобы она связывала эти описания с соответствующими жестовыми данными. Таким образом, мы используем LLMs как платформу для перевода, хотя они в исходном виде не обладают пониманием жестовых языков. Это позволяет связать естественные языки с жестовыми языками в задачах, где доступны ограниченные данные.
## Результаты
Мы проводили эксперименты на двух языках: английском и итальянском. Для оценки нашей модели мы использовали два выборки данных: SignBank+ и LaCAM CNR-ISTC. Эти данные являются стандартизированными и подходят для оценки нашего подхода в обработке жестовых языков. Мы сравнили нашу модель с текущими решениями, включая те, которые используют стандартные методы NMT, предлагаемые для перевода естественных языков. Результаты показали, что наш подход демонстрирует значительные преимущества в условиях с низким количеством данных. Мы получили лучшие результаты по оценке точности перевода и общей эффективности. Это значит, что AulSign может эффективно работать даже в ситуациях, когда другие модели не могут обеспечить достаточную точность.
## Значимость
Мы считаем, что наш подход
Annotation:
Translating natural languages into sign languages is a highly complex and
underexplored task. Despite growing interest in accessibility and inclusivity,
the development of robust translation systems remains hindered by the limited
availability of parallel corpora which align natural language with sign
language data. Existing methods often struggle to generalize in these
data-scarce environments, as the few datasets available are typically
domain-specific, lack standardization, or fail to capture...
Авторы:
Sijie Yang, Binyu Lei, Filip Biljecki
## Контекст
В городском планировании ключевым фактором является обеспечение комфорта и жизнеспособности городских жителей. Несмотря на то, что существуют многочисленные исследования, посвященные оценке и квантификации показателей, связанных с уровнем комфорта — таких как зеленый покров, тепловой комфорт и пешеходная доступность, — отсутствует четкая теоретическая и методологическая рамка для его полноценного измерения в рамках цифровых планировательных процессов. Ранее не было разработано широко признанного фреймворка, который комбинировал бы многоуровневый анализ, открытые данные и искусственный интеллект в структурированном подходе к оценке комфорта в городских пространствах. Наша исследовательская работа стремится заполнить это пробел, создав инновационный фреймворк, который способен оптимизировать процесс принятия решений при городском планировании.
## Метод
Мы разработали многоуровневую методологию, объединяющую различные подходы к измерению комфорта. Фреймворк основывается на трех основных компонентах: (1) **многоуровневый анализ**, который включает в себя различные аспекты городского комфорта, такие как общественно-пространственные факторы, климатические условия и параметры воздушной загрязненности; (2) **уровень данных**, где используются открытые и единообразные данные, такие как OpenStreetMap и данные сетей социальных сетей, для поддержки анализа; (3) **искусственный интеллект**, включающий методы машинного обучения, которые позволяют проводить комплексный анализ и предсказывать уровень комфорта в разных условиях. Эта методология позволяет охватить широкий спектр факторов, влияющих на комфорт городского пространства, сочетая в себе теоретическую структуру и практические приложения.
## Результаты
Мы провели эксперименты на реальных городских сценариях в ряде городов, оценивая уровень комфорта на основе предлагаемого фреймворка. Для этих целей были использованы данные, полученные из различных источников, включая данные зданий, транспортных систем, социальных сетей и датчиков. Эксперименты показали, что фреймворк дает точные и корреляционные результаты в сравнении с традиционными методами. Например, в одном из сценариев было показано, что фреймворк мог предсказать уровень комфорта с точностью до 90%, в то время как традиционный подход давал только 70%. Данные результаты демонстрируют высокую эффективность и надежность предлагаемого подхода.
## Значимость
Предлагаемый фреймворк имеет широкое применение в области городского планирования
Annotation:
Ensuring liveability and comfort is one of the fundamental objectives of
urban planning. Numerous studies have employed computational methods to assess
and quantify factors related to urban comfort such as greenery coverage,
thermal comfort, and walkability. However, a clear definition of urban comfort
and its comprehensive evaluation framework remain elusive. Our research
explores the theoretical interpretations and methodologies for assessing urban
comfort within digital planning, emphasising ...
Авторы:
Kayenat Fatmi, Mohammad Abbas
## Контекст
В современном цифровом пространстве люди подвергаются различным онлайн-угрозам, таким как токсичность, манипуляции, группировка и другие. Эти опасности часто приводят к эмоциональным травмам и рискам для безопасности. Существующие системы, которые обнаруживают токсичность или высылают сигналы о безопасности, работают независимо друг от друга и не включают в себя взаимосвязь между цифровой безопасностью и эмоциональным благополучием. Это главная проблема, которую команда авторов решает, представив SafeSpace — интегрированную платформу, которая объединяет модули для обнаружения токсичности, защиты и оценки отношений.
## Метод
SafeSpace включает три ключевых модуля: (1) обнаружение токсичности в чатах и скриншотах с использованием NLP-моделей и Google Perspective API, (2) систему проверки безопасности с эмергентным оповещением, которая отправляет SOS-сигналы с пользовательским местоположением (долгота и широта) через систему SMTP-почты, и (3) рефлективный опросник, который оценивает здоровье отношений и эмоциональную выносливость. Для управления сигналами используется Firebase, причем модель разработана с учетом модульной архитектуры, что обеспечивает удобство, приватность и масштабируемость.
## Результаты
В ходе экспериментов были проверены 300 случайных примеров токсичности, на которых модель показала 93% точности. Тестирование системы безопасности производилось с использованием эмулятора, показав 100% надёжности. На основе 200 оценок от пользователей, пройдших рефлективный опросник, был получен 92% согласованности между автоматическими и ручными оценками. Это подтверждает эффективность SafeSpace в обнаружении токсичности, предупреждении о рисках и оценке эмоционального состояния.
## Значимость
Предложенная система может применяться в различных сферах, включая образование, социальные сети и личную безопасность. Она объединяет несколько функций в единой платформе, что облегчает пользователям быстрое реагирование на проблемы. Благодаря модульной архитектуре, SafeSpace легко масштабируется и поддерживает приватность. Это может стать мощным инструментом для улучшения эмоционального благополучия и профилактики онлайн-угроз.
## Выводы
SafeSpace доказывает возможность создания интегрированного решения для защиты от онлайн-угроз и поддержки эмоционального благополучия. Будущие исследования будут направлены на улучшение моделей, масштабирование системы и расширение функционала, в том числе переход на мобильные платформы для широкого доступа.
Annotation:
In the digital era, individuals are increasingly exposed to online harms such
as toxicity, manipulation, and grooming, which often pose emotional and safety
risks. Existing systems for detecting abusive content or issuing safety alerts
operate in isolation and rarely combine digital safety with emotional
well-being. In this paper, we present SafeSpace, a unified web application that
integrates three modules: (1) toxicity detection in chats and screenshots using
NLP models and Google's Perspectiv...
Авторы:
Wenhan Dong, Zhen Sun, Yuemeng Zhao, Zifan Peng, Jun Wu, Jingyi Zheng, Yule Liu, Xinlei He, Yu Wang, Ruiming Wang, Xinyi Huang, Lei Mo
## Контекст
Хотя большие языковые модели (LLMs) продемонстрировали свою эффективность в области образовательных приложений, их способность точно оценивать уровень схожести между материалом для чтения и способностями учащихся остается недостаточно изученной. Эта проблема является критической, так как основательным принципом образовательного процесса является Зона Ближайшего Развития (ZPD), которая предполагает соответствие материалов для обучения развитию каждого учащегося. Однако существует ограниченное количество исследований, которые были бы посвящены рассмотрению способности LLMs оценивать сложность чтения в зависимости от возраста учащихся. Эта проблема особенно актуальна в контексте китайского языка, где естественные характеристики языка и культурные особенности могут существенно сказываться на развитии учащихся. В нашем исследовании мы предлагаем ZPD-SCA, подробный бенчмарк для оценки сложности текста для китайского языка, разработанный с учетом ZPD.
## Метод
ZPD-SCA был создан с помощью 60 особых учителей высшей квалификации, которые ранжировали тексты в соответствии с развитием учащихся. Мы использовали данные, собранные из стандартных классов, чтобы создать базу для оценки. Для сравнения использованы модели LLMs, включая Qwen-max и GLM, которые прошли тестирование в задачах нулевого выстрела и с контекстными примерами. Мы точно измерили разницу в производительности с целью выявить уязвимости и преимущества моделей в области образовательных приложений.
## Результаты
Наши результаты показали, что LLMs сталкиваются с ограничениями при нулевом выстреле, так как Qwen-max и GLM даже не достигли случайного угадывания. Однако при использовании контекстных примеров, производительность моделей значительно повысилась. Наиболее продвинутые модели LLMs достигли почти двойного увеличения точности по сравнению с нулевым выстрелом. Тем не менее, мы обнаружили систематические направленные ошибки, что указывает на трудности моделей в точной оценке сложности текста в соответствии с развитием учеников. Эти ошибки были особенно заметны при работе с разными жанрами текстов.
## Значимость
ZPD-SCA может служить основополагающим инструментом для повышения точности оценки сложности чтения в LLMs. Мы видим возможность для развития более точных моделей, которые будут учитывать развитие учащихся в образовательных приложениях. Это может привести к созданию более эффективных инструментов для оценки и развития студентов, особенно в китайской области образования.
## Выводы
Мы демонстрируем, что ZPD-SCA может стать ключевым инструментом для изучения и улучшения LLMs в области образовате
Annotation:
Large language models (LLMs) have demonstrated potential in educational
applications, yet their capacity to accurately assess the cognitive alignment
of reading materials with students' developmental stages remains insufficiently
explored. This gap is particularly critical given the foundational educational
principle of the Zone of Proximal Development (ZPD), which emphasizes the need
to match learning resources with Students' Cognitive Abilities (SCA). Despite
the importance of this alignment, ...
📄 The Role of AI in Facilitating Interdisciplinary Collaboration: Evidence from AlphaFold
2025-08-21Авторы:
Naixuan Zhao, Chunli Wei, Xinyan Zhang, Jiang Li
## Контекст
Область исследования, связанная с использованием искусственного интеллекта (ИИ) в научных исследованиях, набирает все большую популярность. Несмотря на то, что ИИ показал свое влияние в различных областях, его мотивации и перспективы в сфере интеграции разных научных дисциплин остаются неполностью проанализированы. Эта проблема приобретает особую актуальность в контексте того, как ИИ может способствовать улучшению междисциплинарных сотрудничеств. Например, AlphaFold, мощная система сверточного нейронного аппарата, возникла как решение задач генетической структуры белков и стала сильным вдохновителем для исследователей. Однако нет ясности в том, насколько широко ИИ может достигать реальных успехов в сфере междисциплинарных исследований.
## Метод
Для изучения этого вопроса была проведена библиометрическая и статистическая оценка, основывающаяся на анализе 1 247 статей, связанных с AlphaFold, полученных из базы данных Scopus. Авторы использовали метод сравнения, чтобы провести анализ стилей и характеров междисциплинарного сотрудничества между группами, использовавшими AlphaFold, и теми, кто этого не делал. Для этого проводился долгий анализ видов авторских коллабораций и тематик в рамках каждой группы. Эта методология позволила выявить тонкие особенности в характере междисциплинарных взаимодействий, связанных с использованием AlphaFold.
## Результаты
Результаты исследования показали, что ИИ, представленный AlphaFold, привнес незначительного эффекта на увеличение междисциплинарных сотрудничеств в структурной биологии и компьютерных науках — всего 0,48%. В то же время, для других научных областей, таких как биоинформатика или физика, эффекты были незначимыми. Особенностью является то, что ИИ в некоторой степени усиливает требования к сотрудничеству с конкретными дисциплинами, однако эти требования оказываются ограниченными технологической демократизацией и другими факторами.
## Значимость
Эти результаты имеют значительные последствия для теории и практики междисциплинарных исследований. Они показывают, что ИИ, несмотря на свои технические достижения, не является автоматическим средством для объединения разных научных дисциплин. Этот результат может повлиять на стратегии развития ИИ, вынуждая исследователей стараться выстраивать более целенаправленные стратегии для поддержки междисциплинарных сотрудничеств.
## Выводы
Изучение влияния AlphaFold позволило делать вывод о том, что ИИ, несмотря на свои преимущества, имеет ограниченные возможности для того, чтобы значительно изменить характер междисципли
Annotation:
The acceleration of artificial intelligence (AI) in science is recognized and
many scholars have begun to explore its role in interdisciplinary
collaboration. However, the mechanisms and extent of this impact are still
unclear. This study, using AlphaFold's impact on structural biologists,
examines how AI technologies influence interdisciplinary collaborative
patterns. By analyzing 1,247 AlphaFold-related papers and 7,700 authors from
Scopus, we employ bibliometric analysis and causal inference ...
📄 CardAIc-Agents: A Multimodal Framework with Hierarchical Adaptation for Cardiac Care Support
2025-08-21Авторы:
Yuting Zhang, Karina V. Bunting, Asgher Champsi, Xiaoxia Wang, Wenqi Lu, Alexander Thorley, Sandeep S Hothi, Zhaowen Qiu, Dipak Kotecha, Jinming Duan
#### Контекст
Кардиоваскулярные заболевания (СВЗ) остаются ведущей причиной смерти в мире, с тяжелым финансовым и социальным воздействием. Одной из основных причин этой проблемы является значительный дефицит квалифицированных медицинских работников. Искусственный интеллект (AI) имеет потенциал для решения этого вопроса, автоматизируя процессы эскалации, диагностики и прогнозирования. Однако существуют ряд препятствий, которые ограничивают клиническое применение AI-агентов. Эти препятствия включают: неэффективное назначение клинических ролей, опирающееся слишком много на модельные возможности без дополнительной инструментальной поддержки; статические потоки работы, не достаточно адаптивные для персонализированного подхода к кардиологическому лечению; недостаточная гибкость в обновлении знаний и ограниченность интерактивности при необходимости дополнительного обозначения; а также возможности визуального представления результатов. CardAIc-Agents было предложено для устранения этих проблем.
#### Метод
CardAIc-Agents представляет собой многомодальный фреймворк, который объединяет в себе несколько слоев адаптации для поддержки различных задач кардиологии. Основная компонента — CardiacRAG, которая формирует общую стратегию на основе управляемого и обновляемого базы знаний. Далее, этот план исполняется автономно с помощью подсистемы "chief agent", которая использует инструменты для выполнения специфичных задач. Для улучшения адаптивности, применяется стратегия stepwise update, позволяющая динамически обновлять планы в зависимости от результатов предыдущих этапов работы. Кроме того, для поддержки многопрофильных дискуссий, предлагается инструмент для визуального обозначения сложных случаев. В случае необходимости, предоставляется визуальный панельный интерфейс для подтверждения результатов.
#### Результаты
Авторы провели эксперименты на трех различных датасетах, сравнив CardAIc-Agents с основными Vision-Language Models (VLMs), современными агентными системами и моделями VLMs, настроенными на задачу. Результаты показали, что CardAIc-Agents демонстрирует высокую эффективность в сравнении с конкурентными моделями, особенно в случаях сложных задач, требующих адаптивного подхода и гибкой настройки. Эти результаты также подтвердили высокую точность и скорость работы системы при анализе комплексных многомодальных данных.
#### Значимость
CardAIc-Agents предлагает широкие возможности для клинического применения. Он может использоваться для прогнозирования и анализа в сочетании с персонализированными рекомендациями для пациентов. Его гибкая архитектура позволяет адаптироваться к различным ситуациям и требованиям
Annotation:
Cardiovascular diseases (CVDs) remain the foremost cause of mortality
worldwide, a burden worsened by a severe deficit of healthcare workers.
Artificial intelligence (AI) agents have shown potential to alleviate this gap
via automated early detection and proactive screening, yet their clinical
application remains limited by: 1) prompt-based clinical role assignment that
relies on intrinsic model capabilities without domain-specific tool support; or
2) rigid sequential workflows, whereas clinical...
Показано 171 -
180
из 208 записей