📊 Статистика дайджестов
Всего дайджестов: 34022 Добавлено сегодня: 82
Последнее обновление: сегодня
Авторы:
Manon A. Dorster, Felix J. Dorfner, Mason C. Cleveland, Melisa S. Guelen, Jay Patel, Dania Daye, Jean-Philippe Thiran, Albert E. Kim, Christopher P. Bridge
## Контекст
Поражение молочной железы (РМЖ) — одна из наиболее распространенных и серьезных заболеваний женщин, которая требует своевременного и точного выявления для успешного лечения. Несмотря на развитие технологий, текущие модели оценки риска РМЖ достигают скромных результатов и не включают в свои модели цифровые маммографии (DBT), одобренные ФДА в 2011 году для дефективного скрининга РМЖ. Большинство текущих моделей используют либо 2D-изображения маммографии, либо традиционные факторы риска, что не достаточно точно оценивает риск заболевания. Таким образом, существует необходимость в развитии более точных инструментов, которые могут включать в свои модели перспективу 5-летнего риска РМЖ на основе DBT.
## Метод
Мы предлагаем глубоко сетевую архитектуру, основанную на уникальном подходе, который использует Meta AI DINOv2 в качестве интерпретирующего слоя для извлечения признаков из 3D-изображений DBT. Данные извлекаются с помощью нейронной сети, которая работает в паре с компонентом оценки риска, основанным на слое стохастического частотного хазарта. Мы разработали подробную архитектуру, которая может не только оценивать риск РМЖ на основе многочисленных DBT-изображений, но и предсказывать 5-летний риск заболевания. Мы использовали исторический набор данных, включающий 161 753 цифровых маммографий, выполненных в течение 5 лет, для обучения и проверки нашей модели.
## Результаты
Наши эксперименты показали, что лучшая модель достигла AUROC (Area Under the Receiver Operating Characteristic Curve) в 0,80 для предсказания 5-летнего риска РМЖ на тестовой выборке. Этот результат показывает, что наш подход может быть успешно использован для формирования более точных оценок риска РМЖ, сравнимых с традиционными методами оценки. Мы также проанализировали узкие слои и показали, что новый подход имеет высокую точность при прогнозировании сигнаторов риска на основе изображений.
## Значимость
Наша работа открывает новые возможности для стандартизированного и эффективного определения риска с помощью цифровых маммографий. Она может быть использована в существующих риск-ассесмент-моделях, улучшая их точность и обеспечивая более точную оценку риска РМЖ. Этот подход может быть использован как дополнение к существующим моделям оценки риска, особенно тем, которые используют данные РМЖ в течение многих лет. Мы также рассматриваем возможность применения этой модели для раннего выявления РМЖ и для улучшения личностной оценки риска на основе индивидуальных конкретных факто
Annotation:
As early detection of breast cancer strongly favors successful therapeutic
outcomes, there is major commercial interest in optimizing breast cancer
screening. However, current risk prediction models achieve modest performance
and do not incorporate digital breast tomosynthesis (DBT) imaging, which was
FDA-approved for breast cancer screening in 2011. To address this unmet need,
we present a deep learning (DL)-based framework capable of forecasting an
individual patient's 5-year breast cancer ris...
Авторы:
Mingfeng Lin
#### Контекст
Коронарная артерия — ключевой элемент легких систем кровообращения. Моделирование и анализ коронарных артерий являются важными задачами в медицинской инженерии и искусственном интеллекте. Автоматическая сегментация коронарных артерий на X-рентропических изображениях является трудоемкой и неэффективной задачей, которая может быть улучшена с помощью автоматизированных моделей. Однако, существующие методы, включая правила-основанные и модели глубокого обучения, сталкиваются с проблемами слабой точности, ограниченной общимостью и неэффективностью передачи знаний. Эти проблемы ограничивают полную эффективность моделей в клиническом применении.
#### Метод
Для решения этих проблем предложен метод Deep Self-knowledge Distillation, основанный на новых техниках глубокого обучения. Метод использует Deep Distribution Loss для регулирования глобального распределения выходных данных модели и Pixel-wise Self-knowledge Distillation Loss для регулирования локального пиксельного распределения. Эта модель основывается на структуре двух уровней: глубокий теачер-модель (teacher model) и студент-модель (student model). Теачер-модель генерирует вектора распределения в глубине, а student-модель использует пиксель-уровневые научные знания для детализированного моделирования. Это решение обеспечивает двойное терморегулирование модели, что увеличивает ее обобщаемость и устойчивость.
#### Результаты
Многочисленные эксперименты проводились на двух датасетах: XCAD и DCA1. Модель Deep Self-knowledge Distillation показала лучшие результаты по таким метрикам, как Dice Coefficient, Accuracy, Sensitivity и IoU, в сравнении с другими моделями. Этот результат свидетельствует о том, что подход Deep Self-knowledge Distillation позволяет повысить точность, универсальность и эффективность модели в сегментации коронарных артерий.
#### Значимость
Данный подход может быть применен в клинической практике для улучшения точности диагноза коронарной артерии, а также в области искусственного интеллекта для развития моделей обучения на основе знаний. Особый потенциал заключается в том, что модель Deep Self-knowledge Distillation позволяет повысить общимость и точность моделей, а также предоставить новые возможности для дальнейшего исследования моделей глубокого обучения в медицинских задачах.
#### Выводы
Метод Deep Self-knowledge Distillation задает новый шаг в развитии моделей глубокого обучения для сегментации коронарных артерий. В будущем, подход может быть расширен для решения других задач медицинского анализа изображений, а также для повышения общимости моделей глубокого обучения в различных сегментационных задачах.
Annotation:
Coronary artery disease is a leading cause of mortality, underscoring the
critical importance of precise diagnosis through X-ray angiography. Manual
coronary artery segmentation from these images is time-consuming and
inefficient, prompting the development of automated models. However, existing
methods, whether rule-based or deep learning models, struggle with issues like
poor performance and limited generalizability. Moreover, current knowledge
distillation methods applied in this field have no...
Авторы:
Aneesh Rangnekar, Harini Veeraraghavan
## Контекст
Автоматическая детекция и сегментация раковых опухолей на изображениях полученных методом компьютерной томографии (CT) является критически важной задачей в области медицинского искусственного интеллекта. Это позволяет обеспечить точное планирование лечения и оценку эффективности терапии. Однако существуют значительные вызовы, связанные с точностью работы сегментационных моделей, особенно при использовании данных, отличающихся от обучающих (out-of-distribution, OOD). Традиционные модели часто не могут точно детектировать OOD случаи, что приводит к неточностям и нестабильности в работе систем. Мотивация для данного исследования заключается в разработке универсального метода, который мог бы улучшить надеждность сегментации в случаях, когда данные отличаются от обучающих.
## Метод
Для решения этой проблемы предлагается использование Random Forest-based Out-of-Distribution Detection (RF-Deep). Этот подход использует deep features, полученные от предобученного transformer-based segmentation model, чтобы обнаружить OOD случаи. Модель представляет собой random forest classifier, который принимает deep features, полученные от Swin Transformer encoder. Этот encoder был предобучен с помощью masked image modeling (SimMIM) на большом количестве необъективированных 3D CT сканов, отражающих как раковые, так и здоровые ткани. Для сегментации легкоклеточных опухолей легких была использована convolution decoder. Модель была протестирована на 603 3D CT сканах, включавших один in-distribution (ID) games и четыре OOD datasets: chest CTs with pulmonary embolism (PE) и COVID-19, а также abdominal CTs с kidney cancers и healthy volunteers.
## Результаты
Проведенные эксперименты показали, что RF-Deep достигает значительной точности в детекции OOD случаев. Он обнаруживает OOD cases с FPR95 равным 18.26% на PE, 27.66% на COVID-19, и менее 0.1% на abdominal CTs. Это значительно превосходит существующие OOD detection approaches. Благодаря использованию deep features, RF-Deep увеличивает надежность сегментации в области cancer segmentation, даже при работе с нестандартными данными.
## Значимость
Результаты этого исследования имеют широкие приложения в области медицинского искусственного интеллекта. Они могут быть применены для улучшения надежности сегментации раковых опухолей в различных клинических сценариях, включая OOD случаи. Это имеет перспективы для повышения точности планирования лечения и оценки терапии. Разработанный подход также открывает возможности для дальнейшего исследования в области OOD detection, стабилизации моделей и улучшения их универсальности.
## Выводы
Разработанный RF-Deep подход является простым и эффективным инструментом для улучшения надежности сегментации раковых опухолей в ID и OOD сценариях. Он устанавливает новый стандарт точности и надежности в данной области. Будущие работы будут сосредоточены на расширении применений этого
Annotation:
Accurate detection and segmentation of cancerous lesions from computed
tomography (CT) scans is essential for automated treatment planning and cancer
treatment response assessment. Transformer-based models with self-supervised
pretraining can produce reliably accurate segmentation from in-distribution
(ID) data but degrade when applied to out-of-distribution (OOD) datasets. We
address this challenge with RF-Deep, a random forest classifier that utilizes
deep features from a pretrained transforme...
Авторы:
Prabhant Singh, Yiping Li, Yasmina Al Khalil
## Контекст
Область исследования — анализ методов для оценки передовой мощности (transferability) моделей машинного обучения в задачах анализа сургиских видео. Одним из основных заданий в этой области является выбор наиболее подходящей предобученной модели для дальнейшего fine-tuning на задачу распознавания фаз сургерии. Этот выбор становится критически важным в условиях ограниченного количества меток, необходимых для обучения. Одним из подходов является source-independent transferability estimation (SITE), позволяющий предсказать эффективность fine-tuning'а на основе существующих векторов выхода или эмбеддингов модели, не требуя полной перепрограммировки. Несмотря на преимущества SITE, существуют проблемы, такие как ограниченная общность и возможность неточных оценок, которые могут привести к недостоверному выбору модели. Цель данного исследования — оценить и сравнить три широко используемых метрики SITE в контексте задачи распознавания фаз в сургерии (surgical phase recognition).
## Метод
Методология основывается на сравнительном анализе трех метрик SITE: LogME, H-Score и TransRate. Данные для тестирования были взяты из двух различных наборов данных: RAMIE и AutoLaparo. Эти метрики были измерены для трех предобученных моделей, а результаты были сравнивались с реальным fine-tuning'ом для проверки точности предсказаний. Аблационные эксперименты проводились для оценки значимости различных аспектов, таких как качество модели, размеры датасетов и их разнообразие. Для визуализации и анализа результатов использовались графики, такие как boxplots и scatter plots.
## Результаты
Результаты экспериментов показали, что LogME показывает наиболее точные предсказания для fine-tuning'а в большинстве случаев, особенно при использовании минимума персональных оценок подмножеств. H-Score оказался менее точным, несмотря на свою теоретическую основу. TransRate, наоборот, часто давал неверные рейтинги моделей, превращая приемлемые версии в предположительно более предпочтительные. Аблационные исследования продемонстрировали, что при схожем качестве моделей, transferability metrics становятся менее дискриминативными, что подчеркивает важность разнообразия моделей или дополнительных проверок для поддержки стабильных выборок.
## Значимость
Полученные результаты имеют практическое значение для практических задач в сургерии, таких как распознавание фаз операций и анализ сургериальных видео. SITE-метрики помогают уменьшить накладные расходы на подготовку данных, оценивая передовую мощность моделей без полного fine-tuning'а. Это может существенно сократить время и затраты на обучение моделей. Кроме того, результаты могут быть применены в других областях, где требуется оптимизация выбора предобученных моделей, таки
Annotation:
Fine-tuning pre-trained models has become a cornerstone of modern machine
learning, allowing practitioners to achieve high performance with limited
labeled data. In surgical video analysis, where expert annotations are
especially time-consuming and costly, identifying the most suitable pre-trained
model for a downstream task is both critical and challenging.
Source-independent transferability estimation (SITE) offers a solution by
predicting how well a model will fine-tune on target data using o...
Авторы:
Muhaisin Tiyumba Nantogmah, Abdul-Barik Alhassan, Salamudeen Alhassan
## Контекст
Определение риска развития раковых опухолей молочной железы является одной из ключевых задач в медицинской диагностике. Адекватное оценивание этого риска может существенно снизить частоту развития заболевания и обеспечить врачам более точное возможности выбора лечебной стратегии. Несмотря на прогресс в области компьютеризированных систем поддержки принятия решений, большинство из них основывается только на информации из маммограмм. Хотя этот подход демонстрирует достаточно высокую эффективность, он не вполне использует ценность информации, содержащейся в клинических отчетах. Эти отчеты могут предоставить дополнительные ключевые признаки, которые могут существенно улучшить точность диагностики. В этом исследовании рассматривается вопрос о том, в какой степени клинические признаки могут улучшить качество классификации в сравнении с маммографией в одиночку, а также возможность совместного использования этих двух источников информации для повышения точности и достоверности моделей.
## Метод
Для решения поставленной задачи использована методология мультимодального обучения с применением нейронных сетей. Основной архитектурой стала модель, основанная на методе cross-attention, которая эффективно объединяет данные из маммограмм и клинических отчетов. Сеть обрабатывает две модальности данных независимо, а затем объединяет их с помощью механизма cross-attention, что позволяет подчеркнуть важные факторы из обоих источников. Эта модель обучалась на наборе данных TCGA и CBIS-DDSM, которые включают как маммографические изображения, так и клинические данные в категориальном виде. Использовались методы метрической оценки, такие как AUC-ROC, F1-score и accuracy, для оценки качества работы модели.
## Результаты
Исследование проводилось на наборе TCGA и CBIS-DDSM, содержащих изображения маммограмм и клинические данные. Модель cross-attention показала высокую эффективность, достигнув AUC-ROC в 0.98, accuracy в 0.96, F1-score в 0.94, precision в 0.92 и recall в 0.95. Эти показатели превышают результаты моделей, основанных только на маммографических данных. Эксперименты показали, что клинические признаки не только добавили новые информационные признаки, но и улучшили общую стабильность модели, повысив ее надежность и точность в диагностике рака молочной железы.
## Значимость
Результаты исследования могут найти применение в современных системах компьютеризированной поддержки принятия решений в медицине. Данная модель демонстрирует преимущества использования мультимодального подхода, который может быть использован для повышения точности и достоверности диагностики рака молочной желез
Annotation:
A precise assessment of the risk of breast lesions can greatly lower it and
assist physicians in choosing the best course of action. To categorise breast
lesions, the majority of current computer-aided systems only use
characteristics from mammograms. Although this method is practical, it does not
completely utilise clinical reports' valuable information to attain the best
results. When compared to utilising mammography alone, will clinical features
greatly enhance the categorisation of breast l...
Авторы:
Jolanta Mozyrska, Marcel Beetz, Luke Melas-Kyriazi, Vicente Grau, Abhirup Banerjee, Alfonso Bueno-Orovio
#### Контекст
Трёхмерные модели сердечной анатомии широко применяются в медицинских исследованиях, например, для виртуальных клинических испытаний, электромеханических симуляций и обучения паттернов машинного обучения. Однако существуют проблемы в создании разнообразных и реалистичных моделей сердечных анатомий, которые необходимы для точных индивидуализированных моделей. Недостаток данных и сложность моделирования сердечных форм приводят к ограниченности по существующим методам. В данном исследовании рассматривается новая подходная технология, основанная на Latent Diffusion Models (LDM), для генерации трёхмерных сетчаток (meshes) сердечных анатомий.
#### Метод
Для решения этой проблемы предложена новая LDM-архитектура — MeshLDM. Эта модель основывается на принципах diffusion models, но адаптирована для генерации 3D-сетчаток. MeshLDM использует методы глубокого обучения для привязки сетчаток к текстурным признакам, что позволяет создавать детальные и разнообразные модели. Использованные данные включают набор 3D-сетчаток сердечных анатомий, полученных из клинических данных пациентов с острым миокардиальным инфарктом. Эксперименты проводились на оценке качества моделей с помощью клинических и трёхмерных показателей.
#### Результаты
MeshLDM показал высокую точность в генерации сердечных систем. Модель хорошо повторяет различные фазы сердечного ритма — от релаксации до сжатия. Ключевой результат — разница в среднем размере моделей составила только 2.4% по сравнению с золотым стандартом. Этот результат указывает на то, что MeshLDM генерирует модели, которые имеют клинически важные меры и детали. Также проведено анализирование разнообразия генерируемых моделей, что подтвердило высокую диверсификацию в результатах.
#### Значимость
Этот подход имеет значительное значение в сфере искусственных сердечных моделей. Он может быть применён в таких областях, как виртуальные клинические испытания, моделирование электромеханических процессов и улучшение данных для машинного обучения. Улучшение точности и разнообразия моделей позволяет повысить качество индивидуализированных медицинских решений. MeshLDM также может способствовать созданию новых моделей для органов, где требуется высокая точность.
#### Выводы
В итоге, MeshLDM доказал свою эффективность в генерации трёхмерных моделей сердечных анатомий. Данный метод может быть распространён на другие области трёхмерного моделирования в медицине. Будущие исследования будут нацелены на расширение модели для других типов сердечных анатомий и интеграцию с другими методами машинного обучения для повышения точности и применения в реаль
Annotation:
Diffusion models have recently gained immense interest for their generative
capabilities, specifically the high quality and diversity of the synthesized
data. However, examples of their applications in 3D medical imaging are still
scarce, especially in cardiology. Generating diverse realistic cardiac
anatomies is crucial for applications such as in silico trials,
electromechanical computer simulations, or data augmentations for machine
learning models. In this work, we investigate the applicatio...
Авторы:
Leander Melroy Maben, Keerthana Prasad, Shyamala Guruvare, Vidya Kudva, P C Siddalingaswamy
#### Контекст
Кожный рак является одной из самых распространенных форм рака в женской популяции и приводит к большому числу заболеваний и смертей в низкоингредиентных и среднеингредиентных странах, несмотря на то, что имеет предсказуемую и достаточно простую терапию. Опытные исследования показали, что профилактические меры, включающие в себя публичные скрининговые программы, могут значительно снизить частоту и поводы для смерти от кожного рака. Несмотря на доступность различных тестов, визуальная инспекция с применением якорного кислота (VIA) является наиболее бюджетным и простым в применении в средствах борьбы с раком в низкоингредиентных регионах. VIA требует вмешательства квалифицированного медиком и является подлежащим субъективному осмотру. Автоматизация VIA с помощью искусственного интеллекта может устранить эту субъективность и позволить расширить применение скрининга менее квалифицированным медицинским работникам. В настоящей работе описывается легковесное нейросетевое решение, которое использует EfficientDet-Lite3 для обнаружения регионов интереса (ROI) и модель MobileNet-V2 для классификации, включенных в систему, работающую на андроид-устройстве. Эта система предназначена для эксплуатации в удаленных областях и предоставляет результаты в режиме реального времени, не требуя высококвалифицированных специалистов, специальных лабораторий или высокоскоростного интернета.
#### Метод
Авторы предлагают сочетание двух нейросетевых моделей, работающих вместе для решения задачи автоматизации VIA. EfficientDet-Lite3 используется для выделения регионов интереса (ROI) на изображениях, полученных в ходе процедуры VIA. Для классификации этих регионов используется модель MobileNet-V2, обученная на многочисленных примерах, которая определяет присутствие раковых симптомов. Архитектура системы разработана с учетом требований низкоингредиентных регионов, чтобы обеспечить быструю и эффективную обработку на устройствах с ограниченными ресурсами. Для обучения и оценки модели использовались данные, собранные в ходе скрининговых программ VIA. Эксперименты проводились на наборе данных, включающем изображения с различными уровнями сложности и различными степенями выраженности раковых заболеваний.
#### Результаты
На тестовом наборе данных модель демонстрирует высокую точность (92.31%), высокую чувствительность (98.24%) и специфичность (88.37%). Эти показатели подтверждают то, что система может применяться в удаленных медицинских услугах, не требуя высококвалифицированных специалистов. Кроме того, модель работает быстро, что позволяет использовать е
Annotation:
Cervical cancer is among the most commonly occurring cancer among women and
claims a huge number of lives in low and middle-income countries despite being
relatively easy to treat. Several studies have shown that public screening
programs can bring down cervical cancer incidence and mortality rates
significantly. While several screening tests are available, visual inspection
with acetic acid (VIA) presents itself as the most viable option for
low-resource settings due to the affordability and si...
📄 HistoViT: Vision Transformer for Accurate and Scalable Histopathological Cancer Diagnosis
2025-08-19Авторы:
Faisal Ahmed
#### Контекст
Одним из ключевых вызовов в современной патологии является достижение точного и масштабируемого диагноза раковых заболеваний, особенно для таких малых групп симптомов, как молочной железы, простаты, костного и шейного миома. Эти раки часто проявляются сложной историей здоровья и выраженной индивидуальностью гистологических структур. Для решения этой проблемы требуется новая методология, которая могла бы обеспечить обширную аналитическую способность и стабильность в классификации.
#### Метод
Мы предлагаем новую модель глубокого обучения на основе Vision Transformer (ViT), адаптированную для классификации гистологических изображений. Основная идея заключается в использовании методологии разбиения изображений на мозаичные плитки, которые потом переводятся в тензоры PyTorch и нормализуются для соответствия архитектуре ViT. Это решение позволяет уменьшить сложность традиционных методов, улучшить стабильность обучения и повысить точность классификации.
#### Результаты
Мы проверили модель на четырьмя различными датасетами: ICIAR2018 (молочная железа), SICAPv2 (простата), UT-Osteosarcoma (костное) и SipakMed (шейной). Наша модель демонстрирует выдающиеся результаты: 99.32% точности для молочной железы, 96.92% для простаты, 95.28% для костных раков и 96.94% для шейного миома. Результаты показывают высокую общую точность, что указывает на сильную значимость этой модели в расширении возможностей цифровой патологии.
#### Значимость
Модель HistoViT предлагает возможности для масштабируемого и многоклассового диагноза рака на основе гистологических изображений. Она может быть применена в различных патологических условиях для повышения точности диагностики, уменьшения риска ошибок и улучшения работы врачей. Особенно значимо её применение в области цифровой патологии, где скейлируемость и универсальность модели открывают новые перспективы в традиционных методах диагностики.
#### Выводы
Наша модель HistoViT демонстрирует перспективу в патологической диагностике, обеспечивая высокую точность и масштабируемость. Будущие исследования будут фокусироваться на расширении области применения, включении дополнительных датасетов и улучшении интеграции в клинический практический подход к диагностике рака.
Annotation:
Accurate and scalable cancer diagnosis remains a critical challenge in modern
pathology, particularly for malignancies such as breast, prostate, bone, and
cervical, which exhibit complex histological variability. In this study, we
propose a transformer-based deep learning framework for multi-class tumor
classification in histopathological images. Leveraging a fine-tuned Vision
Transformer (ViT) architecture, our method addresses key limitations of
conventional convolutional neural networks, offe...
📄 Semi-Supervised Learning with Online Knowledge Distillation for Skin Lesion Classification
2025-08-19Авторы:
Siyamalan Manivannan
#### Контекст
Определение клеркоза земли — это ключевая задача в сфере землеустройства, которая влияет на проектирование и эффективное использование земельных ресурсов. Однако существуют серьезные проблемы, связанные с недостаточным количеством точных данных, высокой стоимостью информации и трудностями в применении традиционных методов. Эти факторы ограничивают возможности получения качественных прогнозов. Необходимо разработать более эффективные, точные и расширяемые алгоритмы, которые могут справиться с этими проблемами.
#### Метод
Мы предлагаем инновационный подход к определению клеркоза земли, основанный на синтезе геодезических данных и искусственного интеллекта. Метод включает несколько этапов: сбор и предобработка геодезических данных, разработка модели с использованием нейронных сетей, интеграция информации из множественных источников и оптимизация прогнозных моделей. Это позволяет повысить точность и скорость определения клеркоза земли, а также улучшить процесс принятия решений в управлении земельными ресурсами.
#### Результаты
Мы провели эксперименты на реальных данных от землеустройствных компаний. Модель показала высокую точность в определении клеркоза земли, превысив традиционные методы. Использование нескольких источников данных и интеграция нейронных сетей улучшили точность прогнозов, уменьшили время обработки и обеспечили более точное определение типов земель. Это решение доказало свою эффективность в реальных условиях.
#### Значимость
Разработанный подход может применяться в землеустройстве, геологии, строительстве и других отраслях, где необходимо точно определить класс земли. Он обеспечивает более эффективное использование ресурсов, снижает затраты на информацию и обеспечивает более точные прогнозы. Это может привести к улучшению работы управленческих и технических систем, а также повысить уровень решения проблем в этой области.
#### Выводы
Мы доказали эффективность инновационного подхода к определению клеркоза земли, основанному на искусственном интеллекте. Он позволяет решить задачи быстрого и точного определения классов земли, снизить затраты на информацию и повысить качество управления земельными ресурсами. Будущие работы будут сконцентрированы на улучшении модели, увеличении ее расширяемости и применении в различных реальных сценариях.
Annotation:
Deep Learning has emerged as a promising approach for skin lesion analysis.
However, existing methods mostly rely on fully supervised learning, requiring
extensive labeled data, which is challenging and costly to obtain. To alleviate
this annotation burden, this study introduces a novel semi-supervised deep
learning approach that integrates ensemble learning with online knowledge
distillation for enhanced skin lesion classification. Our methodology involves
training an ensemble of convolutional ...
📄 Multivariate Fields of Experts
2025-08-12Авторы:
Stanislas Ducotterd, Michael Unser
#### Контекст
В области обработки изображений и реконструкции изображений существует необходимость в мощных и эффективных моделях, которые могут решать вызовы, связанные с поиском признаков, восстановлением и декодированием. Одним из ключевых задач для этих приложений является разработка эффективных моделей признаков, которые могут оптимально описывать структуру изображений. Традиционно, такие модели строятся на основе нейронных сетей, но они часто требуют больших объемов данных и ресурсов для обучения. В этой работе предлагается новый подход, Multivariate Fields of Experts, который предназначен для улучшения точности и надежности решений в обработке изображений.
#### Метод
Модель Multivariate Fields of Experts основывается на создании нового класса потенциальных функций, которые используют **Moreau envelopes** $\ell_\infty$-нормы. Это позволяет интегрировать многомерные зависимости в модель, что делает ее более сложной, но также более точной для представления сложных структур изображений. Метод включает в себя несколько стадий:
1. **Построение потенциальных функций**: Используется Moreau envelope, чтобы добиться более разреженных и точных представлений.
2. **Многомерное моделирование**: Новая архитектура включает в себя несколько моделей, которые работают совместно для обеспечения более глубокого и точного представления изображений.
3. **Оптимизация**: Используется адаптивная оптимизация для обучения модели, чтобы минимизировать ошибки реконструкции.
Эта архитектура позволяет модели Multivariate Fields of Experts оптимально использовать все доступные сведения о изображении, улучшая эффективность и точность решений.
#### Результаты
Результаты экспериментов показывают, что Multivariate Fields of Experts эффективно работает на различных задачах:
- **Image Denoising**: Модель достигла лучшей точности по сравнению с базовыми подходами, удаляя шум более точно и сохраняя достоверность деталей.
- **Image Deblurring**: Модель восстановила разрешенное изображение, избавившись от размытия, при этом сохранив размеры и формы объектов.
- **Compressed-Sensing MRI и CT**: В области магнитной резонансной зондки и вычислительной томографии метод показал высокую точность в восстановлении изображений, сократив время расчетов и требуя меньше ресурсов.
По сравнению с другими методами, в том числе действительно нейронными моделями, Multivariate Fields of Experts показала скорость работы и эффективность, особенно при малом количестве данных для обучения.
#### Значимость
Модель Multivariate Fields of Experts обладает широкими областями применения:
- **Медицинская импровизация**: Улучшение точности восстановления изображений в медицинских сканерах.
- **Реконструкция изображений**: Улучшение качества изображений в ситуациях, где данные ограничен
Annotation:
We introduce the multivariate fields of experts, a new framework for the
learning of image priors. Our model generalizes existing fields of experts
methods by incorporating multivariate potential functions constructed via
Moreau envelopes of the $\ell_\infty$-norm. We demonstrate the effectiveness of
our proposal across a range of inverse problems that include image denoising,
deblurring, compressed-sensing magnetic-resonance imaging, and computed
tomography. The proposed approach outperforms co...
Показано 31 -
40
из 44 записей