📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 0

Последнее обновление: сегодня
Авторы:

Shayan Bafandkar, Sungyong Chung, Homa Khosravian, Alireza Talebpour

## Контекст Engineering education исторически ограничивается стандартизированными фреймворками, не учитывающими разнообразие студенческих потребностей и интересов. Несмотря на прогресс в области онлайн-образования в K-12 и фундаментальных науках, инновации в обучении инженеров на уровне бакалавриата и магистратуры остаются редкостью. Традиционные методы оценки, такие как экзамены и домашние задания, часто не учитывают индивидуальных нужд студентов, что мешает созданию персонализированных образовательных опытов. Для решения этих проблем предлагается Personalized AI-Powered Progressive Learning (PAPPL), расширенная система интеллектуального преподавания (ITS), ориентированная на обеспечение индивидуальной поддержки в обучении инженеров. ## Метод PAPPL основывается на современных технологиях AI, включая LLM GPT-4o, для построения сценариев обучения, адаптированных к контексту. Оно включает в себя модули: экспертный модуль, студенческий модуль, модуль преподавателя и пользовательский интерфейс. Платформа анализирует попытки студентов, выявляет повторяющиеся недопонимания и формирует динамические, учитывающие прогресс, фидбек. Она также предоставляет преподавателям аналитические инструменты для оптимизации реакций на потребности студентов. Эта разработка является почву для развития ITS, которая может быть масштабирована для различных уровней образования. ## Результаты Экспериментальные тесты PAPPL показали, что онлайн-обучение поддерживает персонализацию и стимулирует прогресс. Анализ данных подтверждает эффективность индивидуального подхода к обучению. Студенты, использующие PAPPL, показали улучшения в понимании концепций и прогресс в решении задач, чем те, кто поreлачивался с традиционными методами. ## Значимость PAPPL может применяться в STEM-образовании и за его пределами, обеспечивая динамичность и систематическую поддержку. Оно предоставляет преимущества в улучшении обучения, аналитики и отслеживании прогресса. В будущем могут проводиться исследования по расширению функциональности и интеграции новых AI-технологий для еще более эффективного обучения. ## Выводы PAPPL достигает прогресса в области Generative ITS, показывая возможности для развития образовательных систем. Будущие исследования должны сфокусироваться на масштабировании, интеграции новых технологий и улучшении интерактивности для широкого использования в образовательных процессах.
Annotation:
Engineering education has historically been constrained by rigid, standardized frameworks, often neglecting students' diverse learning needs and interests. While significant advancements have been made in online and personalized education within K-12 and foundational sciences, engineering education at both undergraduate and graduate levels continues to lag in adopting similar innovations. Traditional evaluation methods, such as exams and homework assignments, frequently overlook individual stude...
ID: 2508.14109v1 cs.CY, cs.AI, cs.ET
Авторы:

Gabrielle Wehr, Reuben Rideaux, Amaya J. Fox, David R. Lightfoot, Jason Tangen, Jason B. Mattingley, Shane E. Ehrhardt

#### Контекст Современные искусственные интеллектные системы ускоряют научные исследования, обрабатывая огромные объемы данных и выполняя специализированные задачи, такие как принятие решений в сложных ситуациях. Однако они ограничены в областях применения и требуют постоянного участия человека в работе. Увеличение количества научных публикаций и специализация в различных областях делают возможным продвижение результатов в новых направлениях, но человеческие мозги и ресурсы не всегда могут справиться с такими задачами. Это привело к развитию искусственных личностей с более широкими мощностями для выполнения научных исследований и проведения экспериментов. #### Метод Исследователи развили доменно-независимую агентную систему AI, которая может проводить все этапы научных исследований, включая гипотезу, сбор данных, анализ и подготовку текстов. Она провела эксперименты в области психологического опыта на 288 участниках, анализировала результаты и сама формировала выводы, подготавляя полные тексты статей. Основной технологией, применяемой в работе, является рекуррентный нейронный сети, работающий в течение долгого времени в режиме самостоятельного управления генерации текста. #### Результаты Система показала способность решать трудные научные задачи, такие как разработка концепций и исполнение новых экспериментов. Она провела эксперименты по визуальной работе памяти, психологии и визуальной иммерсии, где отдельные этапы работы занимали до 8 часов. На основе проведенных экспериментов были сформированы новые теоретические модели и подготовлены статьи. В результате, система демонстрировала возможность выполнения научных исследований с поддержкой теоретических выводов и технических приемов, которые могут соответствовать опыту специалистов. #### Значимость Данная система может применяться в различных научных областях, включая физику, биологию и психологию, что позволит выполнять эксперименты и строить теории без постоянного участия человека. Она способна сама по себе выполнять различные этапы научных исследований, что может ускорить процесс и позволить выявить новые возможности в науке. Но есть и недостатки, такие как ограниченность в понимании теоретических подробностей и трудности в интерпретации результатов. #### Выводы Выполненные выше исследования показали, что ИИ может выполнять широкий спектр научных задач, включая теоретическое решение и самостоятельное выполнение экспериментов. Но есть и недостатки, такие как трудности в понимании теоретических моделей и ограниченность в теоретическом анализе.
Annotation:
Artificial intelligence systems are transforming scientific discovery by accelerating specific research tasks, from protein structure prediction to materials design, yet remain confined to narrow domains requiring substantial human oversight. The exponential growth of scientific literature and increasing domain specialisation constrain researchers' capacity to synthesise knowledge across disciplines and develop unifying theories, motivating exploration of more general-purpose AI systems for scie...
ID: 2508.13421v1 cs.AI, cs.ET
Авторы:

Ken Huang, Yasir Mehmood, Hammad Atta, Jerry Huang, Muhammad Zeeshan Baig, Sree Bhargavi Balija

## Контекст Область исследования сосредоточена на создании безопасных и надежных систем для агентских веб-приложений, нацеленных на снижение рисков, связанных с логическими угрозами, такими как логические недопустимые операции (LPCI, Logic-Permission-Control-Interface Attacks). Эти угрозы, касающиеся несоответствия между агентом и ограничениями доступа к ресурсам, являются ключевыми рисками в средах, где взаимодействие между агентами и системами требует высокой надежности и защиты. Существующие решения часто ограничены уровнем защиты или гибкостью. Наша мотивация заключается в создании унифицированной архитектуры, которая обеспечивает прозрачность и безопасность в агентских системах, учитывая требования агентского веба, такие как децентрализация, безотказная аутентификация и надежная аудитность. ## Метод Мы предлагаем унифицированную архитектуру, основанную на Zero-Trust Identity and Access Management (IAM), в которой идентификация агента построена на Decentralized Identifiers (DIDs) и Verifiable Credentials (VCs). Эти идентификационные элементы обеспечивают уникальность и верифицируемость каждого агента. Для управления ими Discovery Agent Name Service (ANS) использует протоколы, независимые от конкретных технологий. Безопасность реализована с помощью Trust Fabric, включающего в себя Trust-Adaptive Runtime Environments (TARE), которые адаптируют свои параметры в зависимости от ситуации, Causal Chain Auditing для трассировки действий и Dynamic Identity механизмов, которые проверяют поведение агента. Эти компоненты обеспечивают гибкость и безопасность в условиях многослойного доверия. ## Результаты Мы проводили эксперименты с использованием тестовых сценариев, нацеленных на проверку эффективности данной архитектуры в условиях различных LPCI-атак. Использовались данные, симулирующие различные уровни агентского взаимодействия и типов угроз. Результаты показали, что 25% из тестов демонстрируют наличие LPCI-атак, но все они были успешно устранены с более чем 98% вероятностью благодаря использованию Trust Fabric. Другие тесты показали, что архитектура обеспечивает среднюю скорость реакции в 0.005 секунд, что ярко отличается от существующих систем. ## Значимость Наша архитектура может применяться в различных сферах, включая IAM в облачных системах, безопасность в интернете вещей, а также в системах управления доступом к корпоративным ресурсам. Основные преимущества заключаются в безотказной защите от LPCI-атак, высокой гибкости и быстродействии. Мы также отметили потенциальное влияние этого подхода на развитие агентских веб-технологий, повышение уровня безопасности в ци
Annotation:
This paper presents a Unified Security Architecture that fortifies the Agentic Web through a Zero-Trust IAM framework. This architecture is built on a foundation of rich, verifiable agent identities using Decentralized Identifiers (DIDs) and Verifiable Credentials (VCs), with discovery managed by a protocol-agnostic Agent Name Service (ANS). Security is operationalized through a multi-layered Trust Fabric which introduces significant innovations, including Trust-Adaptive Runtime Environments (TA...
ID: 2508.12259v2 cs.CR, cs.AI, cs.ET
Авторы:

Chunliang Hua, Xiao Hu, Jiayang Sun, Zeyuan Yang

## Контекст Современное развитие городских авиационных систем требует эффективного планирования инфраструктуры, чтобы удовлетворить росту спроса на городский воздушный транспорт. Усиливаются усилия по развитию сети вертипортов (vertiports), которые являются ключевыми элементами урбанизированной авиационной мобильности (Urban Aerial Mobility, UAM). Например, в городе Shenzhen планируется развертывать более 1200 вертипортов к 2026 году. Однако существующие методы планирования инфраструктуры не могут корректно учесть такой масштаб, так как ограничены историческими данными и не учитывают сложную динамику пользовательского спроса и ограничений инфраструктуры. Наша исследовательская группа разработала новую модель и рекомендательную систему, которые учитывают эти ограничения и обеспечивают эффективные решения для планирования вертипортов. ## Метод Мы представляем **Capacitated Dynamic Maximum Covering Location Problem (CDMCLP)** – новую оптимизационную модель, которая моделирует запросы транспорта на уровне города, учитывает различные пользовательские поведения и учитывает ограничения инфраструктуры. Модель также включает динамический кластеринг и адаптивную настройку параметров, что позволяет адаптироваться к ситуациям в реальной жизни. При построении рекомендательной системы мы интегрировали CDMCLP с факторами социально-экономического развития и динамическим кластерингом. Такой подход учитывает нерегулярные поведения пользователей и создает рекомендации, которые удобны для практического применения. Мы использовали эмпирические данные для гибкой настройки параметров, чтобы повысить точность планирования. ## Результаты Мы проверили эффективность нашей модели на реальных данных города Shenzhen. Результаты показали, что модель CDMCLP повышает точность планирования в 38%-52% по сравнению с традиционными методами. Рекомендательная система, в свою очередь, демонстрирует легкость понимания и эффективность в сочетании математической модели и практических возможностей. Эта система может быть использована для эффективного развития вертипортов, оптимизируя их расположение и удовлетворение пользовательских потребностей. ## Значимость Наша модель и рекомендательная система могут быть применены не только к вертипортам, но и к другим объектам городской инфраструктуры, таким, как отели или остановки. Их преимущества включают гибкость в адаптации к различным сценариям и интеграцию различных факторов в одной модели. Эти решения могут помочь городам эффективно планировать инфраструктуру, учитывая динамические изменения в пользовательском спросе. ## Выводы Мы доказали,
Annotation:
As urban aerial mobility (UAM) infrastructure development accelerates globally, cities like Shenzhen are planning large-scale vertiport networks (e.g., 1,200+ facilities by 2026). Existing planning frameworks remain inadequate for this complexity due to historical limitations in data granularity and real-world applicability. This paper addresses these gaps by first proposing the Capacitated Dynamic Maximum Covering Location Problem (CDMCLP), a novel optimization framework that simultaneously mod...
ID: 2508.12651v1 cs.AI, cs.ET
Авторы:

Ken Huang, Yasir Mehmood, Hammad Atta, Jerry Huang, Muhammad Zeeshan Baig, Sree Bhargavi Balija

## Контекст Область исследования связана с усилением безопасности в сетевых системах, одной из ключевых задач которой является защита от логических угроз (Logic-layer Threats, LPCI). Эти угрозы проникают в системы через недостатки в логике приложений и системных процессов. Традиционные методы защиты, такие как фаерволлы или проверка подлинности, часто оказываются несовершенными против такой интеллектуальной атаки. Существует необходимость в развитии более устойчивых архитектур, которые могли бы обеспечить безопасность на глубоком уровне, используя подходы, такие как Zero-Trust. Эта мотивация подстегнула разработку архитектуры, которая способна предотвращать, обнаруживать и реагировать на LPCI, используя усовершенствованные методы проверки и аутентификации. ## Метод Авторы предлагают Unified Security Architecture, основанную на Zero-Trust Identity and Access Management (IAM) фреймворке. Эта архитектура использует Decentralized Identifiers (DIDs) и Verifiable Credentials (VCs) для создания достоверных агентных идентитетов. Обнаружение агентов реализовано через Agent Name Service (ANS), который является протокол-агностичным. Безопасность архитектуры операционизируется с помощью Multi-layered Trust Fabric. Этот Trust Fabric включает такие инновации, как Trust-Adaptive Runtime Environments (TARE), Causal Chain Auditing и Dynamic Identity with Behavioral Attestation. Эти компоненты обеспечивают непрерывное мониторинго и реагирование на угрозы. Архитектура также включает в себя строгую формальную модель, которая позволяет проверить противодействие LPCI-угроз. ## Результаты В рамках экспериментов разработчики применяли свою архитектуру к реальной системе, проводя набор экспериментов для оценки ее эффективности. Использовались симуляторы логических угроз и реальные данные для проверки противодействия LPCI. Оценка показала, что архитектура способна эффективно обнаруживать и монорить подозрительные действия, а также адаптироваться к новым типам угроз. Результаты экспериментов включают метрики безопасности, такие как качество обнаружения, реагирование на угрозы и время отклика. Эти результаты доказывают эффективность Zero-Trust IAM-фреймворка в уменьшении LPCI-угроз. ## Значимость Разработанная архитектура может применяться в различных сферах, таких как FinTech, государственные системы, и другие системы, требующие высокой уровней безопасности. Она предоставляет значительные преимущества, такие как уменьшение риска LPCI-угроз, увеличение эффективности аутентификации и мониторинга. Благодаря Zero-Trust принципу, архитектура обеспечивает безопасность даже в ситуациях, когда удаленные системы используются в незащищенных сетях. В будущем, она может стать основой
Annotation:
This paper presents a Unified Security Architecture that fortifies the Agentic Web through a Zero-Trust IAM framework. This architecture is built on a foundation of rich, verifiable agent identities using Decentralized Identifiers (DIDs) and Verifiable Credentials (VCs), with discovery managed by a protocol-agnostic Agent Name Service (ANS). Security is operationalized through a multi-layered Trust Fabric which introduces significant innovations, including Trust-Adaptive Runtime Environments (TA...
ID: 2508.12259v1 cs.CR, cs.AI, cs.ET
Авторы:

Nitin Rai, Nathan S. Boyd, Gary E. Vallad, Arnold W. Schumann

#### Контекст Агроиндустрия сталкивается с вопросами, связанными с распознаванием и классификацией болезней растений, которые могут значительно снизить урожайность и качество сбора. Особенно актуальным является классификация болезней водянистого melon (Citrullus lanatus), так как она наносит огромные ущерба земледелию. Традиционные методы распознавания болезней часто требуют ресурсоёмких внешнего сбора и обработки данных. Однако с появлением generative artificial intelligence (GenAI), а именно моделей, которые генерируют высококачественные синтетические изображения, возникла возможность упростить и ускорить процесс обучения компьютерным зрением. Однако достаточно мало исследований посвящено изучению возможности сочетания синтетических и реальных изображений для повышения точности классификации. В данном исследовании рассматривается эффективность использования синтетических изображений в сочетании с реальными классификации болезней водянистого melon. #### Метод Структура исследования основывается на существующих моделях глубокого обучения, в частности EfficientNetV2-L. Обучение проводилось на специально созданном датасете, содержащем синтетические изображения, сгенерированные с помощью GenAI, а также реальные изображения с обнаруженными в водием болезнями melon. Модель разделилась на пять типов обучения: H0 (только реальные изображения), H1 (только синтетические изображения), H2 (1:1 реальные и синтетические), H3 (1:10 реальные и синтетические), H4 (H3 + добавление рандомных изображений для увеличения вариативности и модели генерализации). Таким образом, исследовалось сочетание синтетических и реальных изображений с целью повышения точности, рекуррентности и F1-меры. #### Результаты Исследование показало, что обучение модели EfficientNetV2-L на смешанных данных (смеси реальных и синтетических изображений) приводит к значительному повышению точности классификации. Например, если модель обучалась только на реальных изображениях (H0), то F1-мера составила 0,65, в то время как при обучении на смеси реальных и синтетических изображений в отношении 1:10 (H3), F1-мера достигла 1,00. Таким образом, модель, обученная на смешанных данных, показала значительное повышение в точности и уменьшение в зависимости от ресурсоёмкого сбора данных. #### Значимость Результаты данного исследования имеют значительное значение для агроиндустрии, так как показывают, что синтетические изображения могут значительно повысить точность классификации, но не могут полностью заменить реальные изображения. Данный подход может быть применён для классификации других зерновых куль
Annotation:
The current advancements in generative artificial intelligence (GenAI) models have paved the way for new possibilities for generating high-resolution synthetic images, thereby offering a promising alternative to traditional image acquisition for training computer vision models in agriculture. In the context of crop disease diagnosis, GenAI models are being used to create synthetic images of various diseases, potentially facilitating model creation and reducing the dependency on resource-intensiv...
ID: 2508.10156v1 cs.CV, cs.AI, cs.ET
Авторы:

Xi Long, Christy Boscardin, Lauren A. Maggio, Joseph A. Costello, Ralph Gonzales, Rasmyah Hammoudeh, Ki Lai, Yoon Soo Park, Brian C. Gin

#### Контекст Информационные технологии становятся важной составляющей в сфере здравоохранения, поддерживая клинические решения и знания. Однако их эффективность зависит от качества данных и точности их интерпретации. Автоматизация процессов сбора и анализа данных с помощью ИИ позволяет ускорить работу, но она не без проблем. Одна из основных проблем — возникновение "халлуцинаций" в искусственном интеллекте, когда система генерирует неверные или неподходящие данные. Данное исследование фокусируется на проблеме различения "халлуцинаций" от интерпретаций человека и на поиске способов повысить точность и эффективность ИИ-помощи в синтезе знаний. #### Метод Для экспериментов использовался ИИ-ориентированный платформа для выполнения синтеза знаний. Авторы исследования оценили работу системы на 187 публикациях с 17 вопросами, полученными из специального специального обзора. Для оценки согласованности ответов сравнивались результаты ИИ и человеческих ответов. Для категориальных вопросов использовалась мера interrater reliability, а для открытых вопросов — тематическая согласованность. Ошибки выявлялись путем сравнения ответов с исходными публикациями. #### Результаты Находилось, что ИИ показывает высокую согласованность с человеческими ответами в тех случаях, когда ответы являются четко определенными и не требуют интерпретации (например, заголовок, цель исследования). Однако при вопросах, требующих субъективного разбора или отсутствующих в исходных данных, согласованность значительно ниже. Практически все ошибки в ответах ИИ были связаны с интерпретационными трудностями (18.3%), в то время как человеческие ошибки происходили намного чаще (4.37%). AI-анализ позволил выявить сложности интерпретации, что позволило улучшить процесс прежде чем передать результаты на человеческий проверку. #### Значимость Естественная синхронность ИИ с человеческими ответами показывает возможность использовать артифициальный интеллект в качестве достоверного и полезного инструмента в знаний синтезе. В то же время, находились значительные отличия во время выявления сложных ситуаций, что подтверждает необходимость человеческого вклада в процесс. Исследование свидетельствует о возможности использования ИИ в процессе знаний синтеза, но также указывает на необходимость осторожности в работе с интерпретируемыми данными. #### Выводы Результаты демонстрируют, что ИИ может стать достоверным и эффективным сопутствующим средством в синтезе знаний, но его работа требует дополнительного анализа и контроля
Annotation:
Knowledge syntheses (literature reviews) are essential to health professions education (HPE), consolidating findings to advance theory and practice. However, they are labor-intensive, especially during data extraction. Artificial Intelligence (AI)-assisted extraction promises efficiency but raises concerns about accuracy, making it critical to distinguish AI 'hallucinations' (fabricated content) from legitimate interpretive differences. We developed an extraction platform using large language mo...
ID: 2508.09458v2 cs.HC, cs.AI, cs.ET
Авторы:

Victor Lopez Juarez

## Контекст В последние десятилетия цифровая регулирование стала важной частью глобальной политики, особенно в сферах искусственного интеллекта (AI), 5G-технологий и цифровой безопасности. Европейский Союз (ЕС) взял на себя лидерскую роль в развитии и внедрении строгих нормативных регулирований в эти области. Однако международная природа цифровых технологий создает вызов для регулирования, которое должно учитывать многообразие локальных контекстов. В этом контексте это исследование фокусируется на влиянии европейского цифрового регулирования на Гватемалу, крайней точке глобальной цепи. Гватемала представляет собой интересный случай для исследования, так как она слабо взаимодействует с ЕС в сфере цифровых технологий, но осуществляет экспорт в ЕС и подвержена его нормам. Это исследование исследует, как ЕС-нормы определяют политики в Гватемале в сферах AI, 5G и цифровой безопасности, а также какие локальные затруднения и возможности возникают в результате этого влияния. ## Метод Методология исследования включает комплексный анализ нормативных документов, сравнительный анализ между европейскими и гватемальскими политиками, а также историко-тенденционный анализ, показывающий динамику взаимодействия между ЕС и Гватемалой. Исследование также использует интервью с экспертами и анализ практик реализации национальных мер в Гватемале. Для анализа влияния европейских норм на Гватемалу в рамках цифровой сферы, используется подход, основанный на теории "Европейского Эффекта" (Brussels Effect), в котором ЕС становится неявным регулятором за пределами собственных границ. Этот эффект охватывает не только прямое влияние ЕС-норм, но и влияние частных стандартов, поставочных цепей и политик контроля данных. ## Результаты Исследование выявило существенное влияние европейских норм на цифровой сектор Гватемалы. Это влияние проявляется в следующих областях: 1. **Правовые и финансовые нагрузки** для малых и средних предприятий (SME), требующих соблюдать европейские стандарты для взаимодействия с международным рынком. 2. **Ограничения в государственных закупках**, когда государственные учреждения должны придерживаться ЕС-нормативных требований при приобретении технологий. 3. **Экологические торговые оффшоры**, возникающие в результате роли ЕС в установлении требований к снижению углеродных выбросов в рамках роли 5G-ролевого провайдера. 4. **Возможные правовые и экономические риски** для прав человека, таких как право на конфи
Annotation:
The paper examines how EU rules in AI, 5G, and cybersecurity operate as transnational governance and shape policy in Guatemala. It outlines the AI Act's risk approach, the 5G Action Plan and Security Toolbox, and the cybersecurity regime built on ENISA, NIS2, the Cybersecurity Act, and the Cyber Resilience Act. It traces extraterritorial channels such as the Brussels effect, private standards, supply chain clauses, and data transfer controls. Guatemala specific impacts include SME compliance cos...
ID: 2508.08315v1 cs.CY, cs.AI, cs.ET
Авторы:

Shady Agwa, Yihan Pan, Georgios Papandroulidakis, Themis Prodromakis

## Контекст Масштабное увеличение сложности сетей нейронных сетей в сфере искусственного интеллекта приводит к возрастающему уровню затруднений в вычислениях. Огромная часть этих вычислений связана с матричными умножениями, которые представляют собой главную часть большинства моделей. Несмотря на развитие различных архитектур вычислений, в том числе ин-памяти, проблемы скорости, энергоэффективности и точности все еще остаются актуальными. Одним из ключевых требований к развитию новых архитектур является повышение эффективности и экономии ресурсов. Однако существующие решения, как цифровые, так и аналоговые, имеют свои ограничения, которые не позволяют полностью решить эти проблемы. Мотивацией для разработки новой архитектуры ОISMA (On-the-fly In-memory Stochastic Multiplication Architecture) является необходимость в более эффективном использовании ресурсов и уменьшении накладных расходов в вычислительных процессах. ## Метод ОISMA представляет собой инновационную подход к вычислениям, основанную на практически стохастическом уровне абстракции. Основной идеей является конвертация обычных операций чтения памяти в стохастические множительные операции с помощью системы "Bent-Pyramid". Эта система позволяет осуществлять внутрипамятные операции умножения, используя только минимальные дополнительные ресурсы. Для суммирования результатов используется резервная периферия, которая агрегирует битстреймы, полученные в результате стохастических умножений. Архитектура строится с учетом модулярности и масштабируемости, чтобы поддерживать различные размеры матриц, начиная от малых до больших (до 512x512). Методология основана на комбинации простоты стохастической аппроксимации и цифровой структуре памяти, что обеспечивает высокую точность и эффективность. ## Результаты Опыты были проведены с размерностями матриц от 4x4 до 512x512. Результаты показали, что для матрицы 512x512 стохастическая архитектура ОISMA демонстрирует снижение среднего относительного ошибки Frobenius до 1,81%, что значительно лучше, чем результаты 64-битного формата двойной точности (6,25%). Это указывает на высокую точность и надежность новой архитектуры. Кроме того, эксперименты по энергоэффективности и плотности вычислений показали, что OISMA может достигать значительно более высокой точности при меньшем потреблении энергии и меньшем объеме вычислительной площади. Например, на технологии 180 нм OISMA достигает энергоэффективности 0.891 TOPS/W и плотности вычислений 3.98 GOPS/mm². Основно
Annotation:
Artificial Intelligence models are currently driven by a significant up-scaling of their complexity, with massive matrix multiplication workloads representing the major computational bottleneck. In-memory computing architectures are proposed to avoid the Von Neumann bottleneck. However, both digital/binary-based and analogue in-memory computing architectures suffer from various limitations, which significantly degrade the performance and energy efficiency gains. This work proposes OISMA, a novel...
ID: 2508.08822v1 cs.AR, cs.AI, cs.ET, cs.PF
Авторы:

Licheng Zhang, Bach Le, Naveed Akhtar, Tuan Ngo

## Контекст Детальная распознаваемость и классификация различных типов дверей на планах помещений является ключевым заданием в таких областях, как проверка соответствия зданий нормам, анализ внутренних сцен и улучшение умных систем управления зданиями. Несмотря на важность этого задания, доступные общедоступные данные для тонкой классификации и распознавания дверей в многоклассовом режиме остаются ограниченными. Отсутствие подобных данных ставит под угрозу развитие инновационных решений в области анализа и моделирования помещений. Для преодоления этой проблемы необходимо разработать метод, позволяющий эффективно создавать и аннотировать большие данные для обучения и тестирования нейросетевых моделей в этой области. ## Метод Предлагаемая методология состоит из двух основных этапов. В первом этапе используется современный объектный детектор для распознавания всех дверей на изображениях планов как единой категории. Во втором этапе применяется значительно мощный языковой модель (LLM), которая классифицирует каждую распознанную дверь на основе её визуальных и контекстуальных признаков. Этот процесс автоматизируется, но включает в себя ручное вмешательство в виде "человека в цепи" для повышения точности и качества аннотированных данных. Эта подходка обеспечивает эффективность и точность в создании больших многоклассовых данных для детекции дверей, а также снижает трудозатраты и затраты ресурсов. ## Результаты Основываясь на предложенной методологии, был создан Dataset DoorDet, содержащий более 10 000 изображений планов с классифицированными двумядверными и многоклассовыми дверями. Данные были аннотированы с помощью LLM и проверены человеком, что обеспечило высокую точность и качество. Эксперименты показали, что данный подход эффективно снижает трудозатраты на аннотацию, без ущерба для качества данных, что делает DoorDet идеальной платформой для тестирования и обучения нейросетевых моделей в области анализа помещений. ## Значимость Предложенный подход имеет широкие области применения, включая проверку соответствия зданий нормам, моделирование интерьеров, улучшение умных систем управления зданиями и многое другое. Основные преимущества метода заключаются в повышении эффективности и точности, а также в существенной сокращении ресурсов за счет автоматизации процесса аннотации. Это демонстрирует потенциал комбинации неглубоких и глубоких методов для эффективного датасета создания в сложных реальных задачах. ## Выводы Разработанный метод DoorDet доказал свою эффективность в построении качественных многоклассовых данных для детекции дверей. Это открывает
Annotation:
Accurate detection and classification of diverse door types in floor plans drawings is critical for multiple applications, such as building compliance checking, and indoor scene understanding. Despite their importance, publicly available datasets specifically designed for fine-grained multi-class door detection remain scarce. In this work, we present a semi-automated pipeline that leverages a state-of-the-art object detector and a large language model (LLM) to construct a multi-class door detect...
ID: 2508.07714v1 cs.CV, cs.AI, cs.ET
Показано 51 - 60 из 67 записей