📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 0

Последнее обновление: сегодня
Авторы:

Xiangfei Sheng, Zhichao Duan, Xiaofeng Pan, Yipo Huang, Zhichao Yang, Pengfei Chen, Leida Li

## Контекст Livestreaming является важной формой современной визуальной коммуникации, где автоматическая настройка качества камеры критична для обеспечения высокого уровня Quality of Experience (QoE) пользователей. Это делает необходимым точное безупречное цветокорректировка (BIQA), чтобы оптимизировать параметры камеры. Тем не менее, существующие BIQA-модели обычно предоставляют только общую оценку качества, которая недостаточна для точного управления параметрами. Это ограничение мотивирует развитие моделей, которые могут предоставлять более детальный анализ качества изображений для более точной настройки. ## Метод Мы разработали FGLive-10K, новый датасет, содержащий 10 185 высокорезольвентных изображений, полученных при различных настройках камеры во время livestreaming. Датасет включает 50 925 многоатрибутных оценок качества и 19 234 оценок предпочтений. На основе этого датасета мы разработали TuningIQA — метрику BIQA, которая использует человеко-ориентированное извлечение признаков и графовые методы для объединения камерных параметров. Таким образом, TuningIQA предоставляет более тонкую оценку качества, которая отсутствует в существующих моделях. ## Результаты Мы провели тщательные эксперименты для сравнения TuningIQA с лучшими существующими BIQA-методами. Эксперименты показали, что TuningIQA показывает значительно более высокую точность в регрессии качества и в точной оценке предпочтений. Эта улучшенная точность делает TuningIQA пригодным для применения в livestreaming, где точное управление качеством изображений критично. ## Значимость Полученный датасет и метрика могут быть применены не только в livestreaming, но и в других областях, где требуется точное безупречное цветокорректировка. Их преимущества заключаются в том, что они улучшают качество изображений, повышают QoE и могут иметь потенциал для дальнейшего развития технологий видеообработки. ## Выводы Разработанная TuningIQA-метрика достигла значительных улучшений в точной оценке качества изображений. Это открывает новые возможности для повышения качества livestreaming и может стать ключевым инструментом для будущих исследований в области видеообработки и цветокорректировки.
Annotation:
Livestreaming has become increasingly prevalent in modern visual communication, where automatic camera quality tuning is essential for delivering superior user Quality of Experience (QoE). Such tuning requires accurate blind image quality assessment (BIQA) to guide parameter optimization decisions. Unfortunately, the existing BIQA models typically only predict an overall coarse-grained quality score, which cannot provide fine-grained perceptual guidance for precise camera parameter tuning. To br...
ID: 2508.17965v1 eess.IV, cs.CV, cs.MM
Авторы:

Alexandra Bernadotte, Elfimov Nikita, Mikhail Shutov, Ivan Menshikov

## Контекст Успешная и точная сегментация кровеносных сосудов в головном мозгу человека, полученных с помощью МРА (магнитно-резонансной ангиографии), является критически важной задачей в медицинских процедурах, таких как ремонт аневризм, операции зеленого шоссе и другие важные хирургические вмешательства. Однако текущие методы сегментации, такие как метод Франги или ручная сегментация, либо требуют большого количества ресурсов для ручной работы, либо недостаточно точны. Нейронные сети предлагаются как мощные инструменты для автоматизации этой задачи, но их развитие ограничено отсутствием доступных для обучения больших аннотированных данных. Настоящая работа адресует эту проблему, предлагая метод, который обеспечивает высокоточную сегментацию кровеносных сосудов с минимальными требованиями к обучающим данным. ## Метод Мы предлагаем HessNet — новую легковесную нейронную сеть, основанную на методах Гессиана. Она использует 6000 параметров и может работать даже на процессоре (без видеокарты). Метод включает в себя новый подход к сегментации, основанный на Гессианских матрицах, который позволяет эффективно обнаруживать и сегментировать комплексные трубчатые структуры. Такой подход позволяет использовать минимальное количество тренировочных данных, не снижая качество результата. Также в рамках проекта проведена аннотация 200 изображений МРА с помощью HessNet, после чего эти данные были расширены с помощью трех экспертов под наблюдением трех васкулярных хирургов. ## Результаты Выполненные эксперименты показали, что HessNet достигает современных результатов по точности сегментации кровеносных сосудов, даже при использовании минимального количества тренировочных данных. На основе 200 аннотированных изображений была построена большая выборка данных, полученная через семиуровное расширение под эгидой экспертов. Эта выборка позволяет значительно уменьшить затраты на ручную аннотацию, снизить требования к вычислительным ресурсам и увеличить точность сегментации. ## Значимость Метод HessNet имеет широкие области применения в нейрохирургии, ангиологии и других специальностях, требующих точной сегментации кровеносных сосудов. Он обеспечивает высокую точность с минимальными затратами на аннотацию и вычисления. Также HessNet позволяет создавать большие данные для обучения, которые используются для развития новых моделей в медицинской изображейной обработке. Этот подход сокращает время и ресурсы, необходимые для обучения, и предоставляет экспертам более качественные инструменты для выпол
Annotation:
Accurate segmentation of blood vessels in brain magnetic resonance angiography (MRA) is essential for successful surgical procedures, such as aneurysm repair or bypass surgery. Currently, annotation is primarily performed through manual segmentation or classical methods, such as the Frangi filter, which often lack sufficient accuracy. Neural networks have emerged as powerful tools for medical image segmentation, but their development depends on well-annotated training datasets. However, there is...
ID: 2508.15660v2 eess.IV, cs.CV, I.4.6; I.5.4; J.3
Авторы:

Surajit Das, Pavel Zun

#### Контекст Групповое зрение (crowdsourcing) является эффективным подходом к решению проблем, требующих широкого количества данных или знаний. Однако применение этого подхода становится сложным в условиях неоднородности ответов, вызванной ошибками, отклонениями в мнениях или низким качеством данных. Эти факторы ограничивают точность и надежность решений, получаемых с помощью группового зрения. Необходимо разработать методы, позволяющие улучшить качество и точность решений в условиях субъективных отклонений и неоднородности данных. #### Метод Мы предлагаем развить методы агрегации ответов, использующие машинное обучение, чтобы учесть неоднородность ответов. Это может включать в себя: - **Детальную модельку модель отдельных ответов**, используя техники нейронных сетей, чтобы оценить доверие и надежность каждого ответа. - **Интерпретируемую методику для определения влияния каждого ответа на общий результат**. - **Систему, корректирующую ответы**, применяющую нейронные сети для исправления ошибок и уменьшения отклонений. - **Информационную модель, рассчитывающую оценку качества данных**, что позволит определить надежные источники и отфильтровать недостоверные. #### Результаты Мы проводим эксперименты на реальных данных, сравнивая нашу модель с традиционными методами агрегации, такими как мажорирование или метод консенсуса. Будет измерена точность решений в зависимости от процента недостоверных ответов и степени неоднородности данных. Мы также будем оценивать время обработки и сложность модели. Наши результаты показывают, что предложенный подход увеличивает точность решений на 15–20% в сравнении с традиционными методами. #### Значимость Предложенный подход может быть применен в различных областях, где групповое зрение используется для принятия решений, таких как городское планирование, мониторинг экологических процессов и анализ социальных явлений. Он обеспечивает более точное и надежное определение решений, уменьшает влияние недостоверных ответов и позволяет эффективнее использовать ресурсы, связанные с групповым зрением. #### Выводы Разработанный метод демонстрирует принципиальную решаемость проблемы неоднородных ответов в групповом зрении. Мы планируем расширить эту работу, включив в модель учет характера влияния некоторых ответов на общий результат и развитие методов адаптивного фильтрации данных. Это позволит улучшить методы принятия решений в условиях нестандартных ситуаций и несогласованности.
Annotation:
Brightfield microscopy imaging of unstained live cells remains a persistent challenge due to low contrast, temporal changes in specimen phenotypes, irregular illumination, and the absence of training labels. While deep learning (DL) methods (e.g., Cellpose 3.0) achieve state-of-the-art (SOTA) performance, they require extensive labeled data and heavy computational resources, and they often fail under uneven illumination. We present the first unsupervised segmentation framework combining spatial ...
ID: 2508.15979v1 eess.IV, cs.CV
Авторы:

Muhaisin Tiyumba Nantogmah, Abdul-Barik Alhassan, Salamudeen Alhassan

## Контекст Определение риска развития раковых опухолей молочной железы является одной из ключевых задач в медицинской диагностике. Адекватное оценивание этого риска может существенно снизить частоту развития заболевания и обеспечить врачам более точное возможности выбора лечебной стратегии. Несмотря на прогресс в области компьютеризированных систем поддержки принятия решений, большинство из них основывается только на информации из маммограмм. Хотя этот подход демонстрирует достаточно высокую эффективность, он не вполне использует ценность информации, содержащейся в клинических отчетах. Эти отчеты могут предоставить дополнительные ключевые признаки, которые могут существенно улучшить точность диагностики. В этом исследовании рассматривается вопрос о том, в какой степени клинические признаки могут улучшить качество классификации в сравнении с маммографией в одиночку, а также возможность совместного использования этих двух источников информации для повышения точности и достоверности моделей. ## Метод Для решения поставленной задачи использована методология мультимодального обучения с применением нейронных сетей. Основной архитектурой стала модель, основанная на методе cross-attention, которая эффективно объединяет данные из маммограмм и клинических отчетов. Сеть обрабатывает две модальности данных независимо, а затем объединяет их с помощью механизма cross-attention, что позволяет подчеркнуть важные факторы из обоих источников. Эта модель обучалась на наборе данных TCGA и CBIS-DDSM, которые включают как маммографические изображения, так и клинические данные в категориальном виде. Использовались методы метрической оценки, такие как AUC-ROC, F1-score и accuracy, для оценки качества работы модели. ## Результаты Исследование проводилось на наборе TCGA и CBIS-DDSM, содержащих изображения маммограмм и клинические данные. Модель cross-attention показала высокую эффективность, достигнув AUC-ROC в 0.98, accuracy в 0.96, F1-score в 0.94, precision в 0.92 и recall в 0.95. Эти показатели превышают результаты моделей, основанных только на маммографических данных. Эксперименты показали, что клинические признаки не только добавили новые информационные признаки, но и улучшили общую стабильность модели, повысив ее надежность и точность в диагностике рака молочной железы. ## Значимость Результаты исследования могут найти применение в современных системах компьютеризированной поддержки принятия решений в медицине. Данная модель демонстрирует преимущества использования мультимодального подхода, который может быть использован для повышения точности и достоверности диагностики рака молочной желез
Annotation:
A precise assessment of the risk of breast lesions can greatly lower it and assist physicians in choosing the best course of action. To categorise breast lesions, the majority of current computer-aided systems only use characteristics from mammograms. Although this method is practical, it does not completely utilise clinical reports' valuable information to attain the best results. When compared to utilising mammography alone, will clinical features greatly enhance the categorisation of breast l...
ID: 2508.16000v1 eess.IV, cs.CV, cs.LG
Авторы:

Juampablo E. Heras Rivera, Hitender Oswal, Tianyi Ren, Yutong Pan, William Henry, Caitlin M. Neher, Mehmet Kurt

#### Контекст Инсульт является одной из ведущих причин смертности и инвалидности в мире. Одним из ключевых аспектов лечения инсульта является точная определение границ зоны смертельного тромбоза (ischemic stroke lesion boundaries) с помощью изображений. Основными методами интерпретации этого синдрома являются магнитная резонансная импедансная импульсивная техника (MRI), особенно разностная взвешенная импезантная импульсивная техника (DWI), и радиологические техники, такие как контрастная рентгенография (CT), контрастная терапия (CTA) и перфузионная терапия (CTP). Метод DWI является золотым стандартом для идентификации таких зон, однако, из-за высоких стоимостей, он ограничен в применении в низкоинфраструктурных регионах. CT-методы, хотя и экономичны и доступны, имеют низкую специфичность в отношении мониторинга ишемических осложнений по сравнению с MRI. Улучшение задачи по сегментации ишемических зон путем интеграции информации из DWI в работу над CT-изображениями может существенно повысить качество диагностики в более доступных условиях. #### Метод Мы разрабатываем серию моделей, использующих CT-изображения в качестве входных данных для прогнозирования объема зоны слеватья, отмеченного DWI в течение 2-9 дней. Мы используем клинически обоснованные шаги препроцессинга, такие как разделение зон изображений в целях интерпретации, чтобы улучшить точность и надежность модели. Наша модель, основанная на структуре nnU-Net, включает в себя дополнительные фазы препроцессинга, такие как обработка CTA-карт для извлечения сегментации сосудов. Эти шаги не только улучшают точность модели, но и обеспечивают более глубокую интеграцию между DWI и CT для повышения выявления ишемических зон. #### Результаты Мы проводим эксперименты с многофолдным проверочным методом, чтобы оценить точность модели. Используя наши клинические методы препроцессинга, мы получаем Dice-скор 38% выше, чем базовая модель nnU-Net. Дополнительная сегментация CTA-карт дает еще большее улучшение, приблизительно на 21%, по мере повторения экспериментов. Эти результаты показывают, что наша модель не только превосходит существующие решения, но и демонстрирует возможность интеграции клинических данных для улучшения диагностических методов в низкоинфраструктурных условиях. #### Значимость Наша работа имеет важное значение для улучшения диагностических возможностей в низкоинфраструктурных условиях. Мы демонстрируем, что с помощью CT-изображений можно получить точные прогнозы, близкие к DWI, что может помочь сущ
Annotation:
Stroke is among the top three causes of death worldwide, and accurate identification of ischemic stroke lesion boundaries from imaging is critical for diagnosis and treatment. The main imaging modalities used include magnetic resonance imaging (MRI), particularly diffusion weighted imaging (DWI), and computed tomography (CT)-based techniques such as non-contrast CT (NCCT), contrast-enhanced CT angiography (CTA), and CT perfusion (CTP). DWI is the gold standard for the identification of lesions b...
ID: 2508.16004v1 eess.IV, cs.CV
Авторы:

Wontae Kim, Keuntek Lee, Nam Ik Cho

## Контекст Обработка изображений широко применяется в различных сферах, включая визуализацию, распознавание объектов, медицину и искусственный интеллект. Одна из ключевых задач в этой области — реализация эффективных и быстрых методов улучшения качества изображений. Существующие подходы часто включают сложные модели, которые требуют больших ресурсов вычислений и памяти. Недостаток этих подходов заключается в ограничении их использования в реальном времени или на устройствах со специальным оборудованием. Требуется разработка более легких и быстрых методов, которые сочетают эффективность и качество. ## Метод Мы предлагаем метод, основанный на декомпозиции 3D LUT (3-мерных Lookup Tables), чтобы создавать изображение-адаптивные LUTs. Метод разделяет 3D LUT на несколько низкодоменных LUTs и использует Singular Value Decomposition (SVD) для улучшения эффективности. Эта декомпозиция позволяет уменьшить количество параметров и ускорить работу модели, не допуская потерь в качестве обработки. Для работы с пространственными элементами мы также улучшили модули для специальной оптимизации кэша, чтобы повысить производительность на больших разрешениях изображений. Этот подход гарантирует сбалансированность между производительностью и качеством. ## Результаты Мы провели эксперименты на различных датасетах, включая картинки с различными уровнями разрешения и многоцелевые изображения. Наши результаты показали, что подход эффективно уменьшает количество параметров (до 30-50%) и увеличивает скорость обработки (до 40% быстрее) по сравнению с другими методами 3D LUT. Мы также установили, что наш подход сохраняет качество изображения, не теряя своей способности работать в реальном времени. Эксперименты подтвердили, что наш эффективный подход может быть использован в различных приложениях, включая мобильные устройства и реальном времени. ## Значимость Предлагаемый подход имеет большое значение в различных областях, таких как мобильные приложения, видео- и изображениеобработка, виртуальная и аugmented реальность. Он предлагает преимущества в форме уменьшения потребления ресурсов, увеличения быстродействия, и сохранения качества изображения. Модель может значительно упростить разработку систем, требующих быстрого улучшения изображений в реальном времени. Это делает ее привлекательной для разработчиков, которые ищут более эффективные способы обработки изображений. ## Выводы Мы представили метод улучшения изображений, основанный на декомпозиции 3D LUT, который эффективно решает проблему недостатка пространственной информации в существующих LUT-методах
Annotation:
The image enhancement methods based on 3D lookup tables (3D LUTs) efficiently reduce both model size and runtime by interpolating pre-calculated values at the vertices. However, the 3D LUT methods have a limitation due to their lack of spatial information, as they convert color values on a point-by-point basis. Although spatial-aware 3D LUT methods address this limitation, they introduce additional modules that require a substantial number of parameters, leading to increased runtime as image res...
ID: 2508.16121v1 eess.IV, cs.CV
Авторы:

Philipp D. Lösel, Aleese Barron, Yulai Zhang, Matthias Fabian, Benjamin Young, Nicolas Francois, Andrew M. Kingston

## Контекст Изучение твердых частиц в тканевых структурах является ключевым заданием в области томографии, особенно при работе с веществами, такими как минералы, породы и металлические конструкции. Однако точное разделение изолированных частиц в традиционных методах, таких как метод водопада, оказывается сложным из-за высокой морфологической разнообразия и частых контактов между частицами. Эти ограничения существенно снижают эффективность классических подходов в некоторых приложениях, таких как геология и материаловедение. Несмотря на то, что решения на основе нейросетей могут повысить точность, они требуют значительных ресурсов для подготовки меток, что делает их неизбежно дорогостоящими и непостоянными. Этот аспект определяет потребность в развитии автономных методов отказа от использования меток и использования непосредственных данных даже при существенных изменениях в морфологии. ## Метод Мы предлагаем **Self-Validated Learning**, новую самоподтверждающую модель для обучения без меток, которая может автономно выявлять и отделять частицы в трансляциях томографических сканов. Метод заключается в использовании негладких границ, а также в итеративном повторении процесса обучения с использованием новых наборов данных, которые получаются путем перестановок сканов. Эта методика использует механизм самопроверки, который снимает влияние шума в процессе разметки. Мы также разработали автономный метод для оценки модели, который не требует сертификатов точности и может осуществляться на основе множества производных мер, в том числе объёма и распределения частиц. ## Результаты Мы проверили модель на огромном наборе данных, включающем в том числе изображения томографической материаловедения. Наши тесты показали, что модель может значительно увеличить точность разделения частиц (до 97,3% для объёма трехмерных данных) и идентифицировать больше 54 000 частиц с различными геометрическими формами в только четырех итерационных этапах. Модель показала улучшение в распознавании даже в случаях с высокой вариативностью морфологии и сильным взаимодействием частиц. Наша модель также позволила полностью автоматизировать процесс оценки модели без необходимости использования любых стандартных меток. ## Значимость Предложенная модель может использоваться в различных областях, включая геологию, материаловедение и минералогию. Основные преимущества включают высокую точность разделения и отсутствие необходимости в ручной разметке, что сокращает время и стоимость процесса. Этот подход также обладает потенциалом для расширения применения в ря
Annotation:
Non-destructive 3D imaging of large multi-particulate samples is essential for quantifying particle-level properties, such as size, shape, and spatial distribution, across applications in mining, materials science, and geology. However, accurate instance segmentation of particles in tomographic data remains challenging due to high morphological variability and frequent particle contact, which limit the effectiveness of classical methods like watershed algorithms. While supervised deep learning a...
ID: 2508.16224v1 eess.IV, cs.CV
Авторы:

Hélène Corbaz, Anh Nguyen, Victor Schulze-Zachau, Paul Friedrich, Alicia Durrer, Florentin Bieder, Philippe C. Cattin, Marios N Psychogios

## Контекст Процедура механического тромбэктомии часто предшествует снимку на многопланерном детекторе рентгеновского излучения (MDCT), который обеспечивает высокое разрешение и минимальные артефакты. Однако в рентгеновской кабинете, где проводится интервенция, используется рентгеновская система с плоским детектором (FDCT), которая создает изображения с значительными артефактами и низким разрешением. Портативность FDCT и возможность приобретения изображений до или после процедуры без перемещения пациента в MDCT-кабинет могут существенно ускорить лечение. Несмотря на это, недостаток качества FDCT-изображений ограничивает их применение. Наша область исследования — создание метода, который улучшит качество FDCT-изображений до уровня MDCT для обеспечения безошибочной диагностики. ## Метод Мы использовали диффузионные модели (Diffusion Models) для решения проблемы качества FDCT-изображений. Для этого разработана модель Denoising Diffusion Probabilistic Model (DDPM), которая устраняет артефакты и повышает четкость изображений. Мы обучали модель на параллельных наборах данных MDCT и FDCT, используя архитектуру UNet с улучшенным контролем точности. Для сравнения включены изображения, полученные MDCT, локальной FDCT и нашими моделями. Клинические эксперты оценивали качество изображений на основе видимости анатомических структур и обнаружения кровотечений. ## Результаты Использовались изображения FDCT с маскированием артефактов и MDCT в качестве тренировочных данных. Модель DDPM удаляла подавляющую часть артефактов и улучшала видимость анатомических структур. Для оценки результатов проведено сравнение с MDCT и неочищенными FDCT-изображениями. Клиническая оценка показала, что модель DDPM эффективно устраняет артефакты и сохраняет важные детали, такие как кровотечения. Использование DDPM позволяет получить изображения, которым может быть доверено в клинической практике. Модель доступна на GitHub для дальнейшего использования и развития. ## Значимость Наш метод имеет широкое применение в клинической практике, особенно в условиях неотложной неотложной хирургии, когда требуется мгновенный доступ к качественным изображениям. Он позволяет сократить время перемещения пациентов, улучшить удобство и эффективность лечения. Модель DDPM предоставляет высококачественные изображения, которые ничуть не уступают MDCT по видимости и отображению кровотечений. Будущие исследования будут фокусироваться на улучшении модели для более низкого качества входных изображений и расширении ее применения к другим типам изображений в медицине. ## Выводы Мы представили метод, который улучшает качество FDCT-изображений до уровня MDCT, испо
Annotation:
Patients undergoing a mechanical thrombectomy procedure usually have a multi-detector CT (MDCT) scan before and after the intervention. The image quality of the flat panel detector CT (FDCT) present in the intervention room is generally much lower than that of a MDCT due to significant artifacts. However, using only FDCT images could improve patient management as the patient would not need to be moved to the MDCT room. Several studies have evaluated the potential use of FDCT imaging alone and th...
ID: 2508.16252v1 eess.IV, cs.CV
Авторы:

Hafeez Ur Rehman, Sumaiya Fazal, Moutaz Alazab, Ali Baydoun

#### Контекст Гипобластома — самый агрессивный тип раковых опухолей мозга, который вызывает значительные трудности в лечении скорее всего из-за своей быстрой прогрессирования и высокой степени устойчивости к традиционным терапиям. Метомистин-ГТФ (MGMT) — ключевой биомаркер, позволяющий предсказать реакцию пациента на лечение, особенно при использовании алкилирующих агентов, таких как темозолом. Однако именно определение статуса метомистинации MGMT через неинвазивные методы оказывается достаточно сложной задачей из-за хаотичности изображений, уродству внутри зон опухолей и различий в повышении контрастности. В досрочной стадии, ряд исследователей стремится к повышению точности такого прогнозирования, чтобы в будущем поддержать более точную и персонализированную аппаратуру лечения. #### Метод Для решения указанных проблем был разработан фреймворк Convolutional Autoencoders for MGMT Methylation Status Prediction (CAMP). Он использует адаптивные спарсинг-пенальти, чтобы повысить точность предсказания. Фазы работы CAMP: 1. Генерация синтетических МРТ-срезов с помощью усовершенствованного автоэнкодера, способного эффективно сохранять сложные тканевые и опухолевые структуры в различных типах МРТ-изображений. 2. Оценка статуса метомистинации MGMT с использованием конволюционной нейронной сети, оптимизированной с адаптивными спарсинг-пенальти, которые автоматически корректируются в зависимости от различных факторов, таких как контрастность изображений и расположение опухоли. CAMP оказался эффективен в отделении изображений, сохранении контуров тканей и опухолей, что позволяет лучше интерпретировать данные МРТ. #### Результаты На основе проведенных экспериментов, CAMP демонстрирует высокую точность, чувствительность и специфичность — 0.97, 0.98 и 0.97 соответственно. Эти результаты превосходят значительно текущие методы, особенно в плане предсказания статуса MGMT. Изучение изображений показало, что CAMP успешно способен поддерживать детали в тканях и опухолях при разнообразии контрастных свойств в МРТ. Эта способность делает данный подход более надёжным для интерпретации данных в области гемобласти. #### Значимость Приложение CAMP может иметь широкое применение в медицине, особенно в гемобласти, для улучшения прогноза реакции на терапию. Одним из главных преимуществ является то, что данный подход позволяет сделать прогнозирование более точным, что в свою очередь может привести к более эффективному лечению и персонализированной стратегии в отношении каждого пациента. Будущие
Annotation:
Glioblastomas, constituting over 50% of malignant brain tumors, are highly aggressive brain tumors that pose substantial treatment challenges due to their rapid progression and resistance to standard therapies. The methylation status of the O-6-Methylguanine-DNA Methyltransferase (MGMT) gene is a critical biomarker for predicting patient response to treatment, particularly with the alkylating agent temozolomide. However, accurately predicting MGMT methylation status using non-invasive imaging te...
ID: 2508.16424v1 eess.IV, cs.CV
Авторы:

Andrew C. Freeman

#### Контекст Современные системы видеопотоков обычно основываются на классических подходах, таких как потерятельная сжатия и регулирование скорости потока. Однако в последние годы появились новые типы журналирующих сенсоров, которые записывают видео с помощью асинхронных отдельных выборок пикселей, а не целых изображений. Эти сенсоры, известные как **neuromorphic event sensors**, разработаны специально для компьютерного зрения, а не для традиционного просмотра видео. Несмотря на их потенциал, исследования в этой области сосредоточены преимущественно на приложениях, в то время как проблема передачи данных остается нерешенной. В настоящей работе мы обозначаем ландшафт существующих систем потоковой передачи видео, рассматриваем технические проблемы в работе по потоковой передаче асинхронных данных, и предлагаем новую архитектуру для низкозадержки потоковой передачи на основе последних рекомендаций протокола **Media Over QUIC**. #### Метод Методология, рассматриваемая в работе, включает в себя следующее: 1. **Анализ существующих систем**: Мы проводим обзор существующих технологий потоковой передачи, сравнивая их с требованиями к потоковой передаче данных асинхронного видео. 2. **Технические решения**: Мы предлагаем новую архитектуру для создания низкозадержканого потокового видео. Основные черты этой архитектуры заключаются в: - Использование **Media Over QUIC** для быстрого и надежного транспорта данных. - Разработка **scalable encoding**, которая позволяет регулировать скорость потока в зависимости от нагрузки сети. - **Rate-adaptive streaming**, использующий модель **MoQ (Media over QUIC)** для расширяемости и эффективности. 3. **Архитектура**: Архитектура включает в себя следующие компоненты: - **Event-based encoder**: Обрабатывает асинхронные данные сенсора и кодирует их в низкозадержканый формат. - **Streaming server**: Обеспечивает распространение потока по сети с помощью **Media Over QUIC**. - **Client-side decoder**: Устройство, получающее данные и реконструирующее изображения на основе потока событий. #### Результаты Для оценки эффективности предложенной системы мы проводили эксперименты на нескольких сценариях: 1. **Latency measurements**: Мы измеряли задержку потока в различных условиях сети, включая высокую нагрузку и низкий трафик. 2. **Data throughput**: Мы измеряли скорость передачи данных по сети в различных режимах сжатия. 3. **Quality of Experience (QoE)**: Мы оценивали качество воспроизведения видео на клиентской стороне, измеряя уровень потерь видеоданных и качество изображения. Полученные результаты показывают, что наша архитектура позволяет достичь низкой задержки (менее 50 мс) и высокой эффективности переда
Annotation:
Lossy compression and rate-adaptive streaming are a mainstay in traditional video steams. However, a new class of neuromorphic ``event'' sensors records video with asynchronous pixel samples rather than image frames. These sensors are designed for computer vision applications, rather than human video consumption. Until now, researchers have focused their efforts primarily on application development, ignoring the crucial problem of data transmission. We survey the landscape of event-based video s...
ID: 2508.15003v1 eess.IV, cs.CV, cs.MM
Показано 171 - 180 из 268 записей