📚 Саммари научных статей из arXiv

Найдено 1732 результатов по запросу 'cs.AI, cs.LG' Сбросить поиск

📊 Статистика дайджестов

Всего дайджестов: 35039 Добавлено сегодня: 432

Последнее обновление: сегодня

📄 Robust Belief-State Policy Learning for Quantum Network Routing Under Decoherence and Time-Varying Conditions

2025-09-12

Авторы:

Amirhossein Taherpour, Abbas Taherpour, Tamer Khattab

## Контекст В теории графов и телекоммуникационных сетях возникает вопрос о оптимальной организации трафика. Наиболее сложными считаются сети супперкубитной технологии, где необходимо учитывать сложные зависимости между узлами в виде энтангленных квантовых связей. Такие системы характеризуются высокой динамичностью, нестационарностью, влиянием шумов и расслаблением энтангления. Оптимальное управление этими системами требует развития новых алгоритмов управления. В настоящей работе рассматривается такой подход для управления трафиком в квантовых сетях, сформулированный в сфере машинного обучения. Подход основывается на применении фреймворка Partially Observable Markov Decision Process (POMDP), который позволяет комбинировать агентскую модель решения задач с графовыми структурами для моделирования сетевых связей. Это решение предназначается для решения проблем, связанных с учетом динамики, нестационарности и шума в квантовых сетях. ## Метод Статья предлагает использовать архитектуру гибридного графового нейронного сети (Graph Neural Network, GNN) с Partially Observable Markov Decision Process (POMDP). Трафик в квантовых сетях описывается в виде графового сетевого пространства, где узлы и связи представляют собой квантовые связи между узлами. На основе этого графа генерируется многомерный вектор, который описывает состояние системы. Такое представление позволяет использовать техники POMDP для расчета доверительных показателей (belief states) и выбора оптимальных маршрутов. Графовые сети обрабатываются с помощью GNN для построения локальных представлений (embeddings), которые поступают в POMDP-фреймворк для выбора оптимальных маршрутов. Для того чтобы учитывать динамику системы и нестационарность, разработчики используют механизм адаптивного шума, который включает в себя анализ шумового воздействия. Это позволяет значительно повысить точность решений в условиях нестационарности. ## Результаты На основе проведенных экспериментов показано, что предложенный подход позволяет достичь значительно более высокой точности в трафике квантовых сетей в сравнении с текущими методами. Использованные данные включали модели квантовых сетей с до 100 узлов. Отмечается, что система не только эффективно решает задачи управления трафиком, но и умеет адаптироваться к изменениям во внешних условиях, таким как шум и расслабление энтангления. Результаты показывают, что система достигает высокой точности в определении маршрутов, что позволяет значительно повысить работу квантовых сетей в условиях нестационарности. Это делается благодаря особенности работы POMDP, которая использует не только текущее

Annotation:

This paper presents a feature-based Partially Observable Markov Decision Process (POMDP) framework for quantum network routing, combining belief-state planning with Graph Neural Networks (GNNs) to address partial observability, decoherence, and scalability challenges in dynamic quantum systems. Our approach encodes complex quantum network dynamics, including entanglement degradation and time-varying channel noise, into a low-dimensional feature space, enabling efficient belief updates and scalab...

ID: 2509.08654v1 quant-ph, cs.AI, cs.LG, cs.NI

arXiv PDF

📄 Explainability of CNN Based Classification Models for Acoustic Signal

2025-09-12

Авторы:

Zubair Faruqui, Mackenzie S. McIntire, Rahul Dubey, Jay McEntee

## Контекст Акустические сигналы животных являются важной источником информации для изучения поведения, экологии и эволюции различных видов. Однако анализ этих сигналов часто сталкивается с проблемами, связанными с их комплексностью и большим объемом данных. В статье рассматривается применение глубоких нейросетей для классификации звуковых сигналов птиц, которые имеют сильную географическую разнообразие в т Tехнологии звукозаписи и анализа позволяют собирать большие объемы данных, но их интерпретация часто требует больших усилий и специализированных знаний. Развитие Искусственного Интеллекта (ИИ) и, в частности, Эксплаинэйбел ИИ (XAI), предлагает новые возможности для понимания и интерпретации результатов акустического анализа. Однако, применение XAI в биоакустике, в частности, в анализе звуков птиц, до сих пор остается недостаточно исследовано. Целью данной статьи является изучение возможностей применения XAI для понимания моделей классификации звуков, а также выявление шаблонов и причин, по которым модель принимает определенные решения. ## Метод Для проведения исследования были использованы звуковые записи птиц из разных районов жизнедеятельности в Северной Америке. Звуковые сигналы были преобразованы в изображения в формате спектрограмм, которые являются входным форматом для нейронной сети. Модель классификации основывалась на архитектуре глубоких совокупных нейронных сетей (CNN), которая была обучена классифицировать звуки на основе их спектрограмм. Для того, чтобы понять, что именно учитывает модель при принятии решения, применены методы Эксплаинэйбл ИИ. Эти методы могут быть разделены на две категории: модельно-зависимые (DeepLIFT, Grad-CAM) и модельно-независимые (LIME, SHAP). Методы LIME и SHAP работают путем создания интерпретируемых представлений входных данных, показывая, какие части сигнала влияют на решение модели. В то же время, DeepLIFT и Grad-CAM относятся к модельно-зависимым методам, которые используют внутреннюю структуру нейросети для показания, как каждая часть входного сигнала влияет на выходную классификацию. ## Результаты Использование CNN для классификации звуков птиц дало высокую точность (94.8%) в распознавании различных типов звуков. Для интерпретации решений модели были применены XAI-техники. Легенды LIME и SHAP показали, какие части спектрограммы имеют сильнейшее влияние на классификацию. Например, LIME показал, что звуки с высокой частотой и сильным амплитудовым диапазоном имеют большую важность для распознавания

Annotation:

Explainable Artificial Intelligence (XAI) has emerged as a critical tool for interpreting the predictions of complex deep learning models. While XAI has been increasingly applied in various domains within acoustics, its use in bioacoustics, which involves analyzing audio signals from living organisms, remains relatively underexplored. In this paper, we investigate the vocalizations of a bird species with strong geographic variation throughout its range in North America. Audio recordings were con...

ID: 2509.08717v1 cs.SD, cs.AI, cs.LG, eess.AS

arXiv PDF

📄 Learning Turbulent Flows with Generative Models: Super-resolution, Forecasting, and Sparse Flow Reconstruction

2025-09-12

Авторы:

Vivek Oommen, Siavash Khodakarami, Aniruddha Bora, Zhicheng Wang, George Em Karniadakis

## Контекст Турбулентные потоки широко распространены в природе и технике, например, в аэродинамике, теплообмене, гидродинамике и гидрологии. Однако моделирование таких потоков чрезвычайно трудозатратно, и наличие детальных данных требуется для точного предсказания. Нейронные операторы, как альтернатива традиционным методам, обладают высокой точностью и эффективностью при моделировании сложных динамических систем. Однако, когда они обучаются с помощью стандартных L2-потерь, они часто преувеличивают сглаживание, что приводит к потере тонких турбулентных структур. Это ограничивает их применение в таких задачах, как суперрезолюция, прогнозирование и восстановление данных с низким разрешением. В данной работе предлагается способ устранения этого недостатка с помощью комбинации нейронных операторов с генеративными моделями. ## Метод Для решения вышеуказанных проблем разработана стратегия, которая объединяет нейронные операторы и генеративные модели. Легковесная генеративная модель используется для обучения нейронного оператора, учитывающего не только линейные свойства, но и нелинейные взаимодействия в данных. Это позволяет улучшить качество моделирования турбулентных структур. Для решения задач суперрезолюции используется адверсарно обученный нейронный оператор (adv-NO), который обеспечивает лучшую точность в представлении турбулентных структур. Для прогнозирования используется более сложная архитектура, обеспечивающая затухание ошибок в течение нескольких сингулярных временных отрезков. Для восстановления данных с низким разрешением развита устойчивая инференциальная модель, которая может восстановить полные трёхмерные потоки с учётом статистических свойств. ## Результаты На задаче суперрезолюции для задачи Schlieren jet, adv-NO показал снижение ошибки спектра энергии на 15 раз по сравнению с традиционными нейронными операторами, сохранив желаемую детализацию. Для 3D-турбулентности, adv-NO продемонстрировал успешное прогнозирование траекторий турбулентных потоков на 5 сингулярных временных отрезков, при этом снизив время работы на 114 раз по сравнению с традиционными методами. Для восстановления турбулентных потоков из спарсе данных, генеративная модель восстановила полные 3D-потоки с поддержкой статистических свойств и точностью в фазе. Эти результаты показывают высокую точность и эффективность модели в решении сложных задач моделирования турбулентных потоков. ## Значимость Разработанные методы могут быть применены в различных областях, таких как аэродинамика, гидродинамика, и даже в сфере интеллектуально

Annotation:

Neural operators are promising surrogates for dynamical systems but when trained with standard L2 losses they tend to oversmooth fine-scale turbulent structures. Here, we show that combining operator learning with generative modeling overcomes this limitation. We consider three practical turbulent-flow challenges where conventional neural operators fail: spatio-temporal super-resolution, forecasting, and sparse flow reconstruction. For Schlieren jet super-resolution, an adversarially trained neu...

ID: 2509.08752v1 physics.flu-dyn, cs.AI, cs.LG

arXiv PDF

📄 Large Language Model Hacking: Quantifying the Hidden Risks of Using LLMs for Text Annotation

2025-09-12

Авторы:

Joachim Baumann, Paul Röttger, Aleksandra Urman, Albert Wendsjö, Flor Miriam Plaza-del-Arco, Johannes B. Gruber, Dirk Hovy

#### Контекст Large language models (LLMs) значительно изменяют область социологических исследований, автоматизируя трудоемкие задачи, такие как аннотация данных и текстовый анализ. Однако выводы LLMs зависят от решений, которые принимают исследователи, таких как выбор модели, стратегия подсказок или настройки температуры. Эти отличия могут привести к систематическим уклонкам и случайным ошибкам, которые влияют на дальнейший анализ и приводят к ошибкам различного рода (Type I, Type II, Type S или Type M). Название этого явления — LLM hacking. Цель нашего исследования — оценить риски LLM hacking и разработать методы его снижения. #### Метод Мы проводили эксперименты с 37 задачами аннотации данных из 21 публикаций в области социальных наук, используя 18 различных LLMs. Обработав 13 миллионов меток, мы тестировали 2 361 гипотез, определяя, как различные реализационные решения влияют на статистические выводы. Наши эксперименты охватывают многие реалистичные сценарии использования LLMs в социологических исследованиях. #### Результаты Мы обнаружили, что примерно в треть случаев, если использовать выводы стандартных моделей, ведут к неверным статистическим выводам. У меньших моделей этот процент достигает половины. Мы обнаружили, что высокая точность модели и лучшая общая модельная качество снижают риск LLM hacking, но даже высокоточные модели не могут полностью исключить это риско. Также мы обнаружили, что чем больше эффектный размер, тем меньше риска ошибок, что подтверждает нужду в более строгих проверках значимости. Мы также проанализировали множество методов снижения LLM hacking, таких как жесткое верифицирование результатов, и показали, что значительное улучшение может быть достигнуто с помощью ручных аннотаций. #### Значимость Наше исследование имеет значительные приложения в социологических исследованиях, а также в других областях, где LLMs используются для автоматизации задач текстового анализа. Мы показали, что LLM hacking может привести к серьезным ошибкам в исследовательских выводах, что требует большей внимательности к процессу верификации данных. Мы также выявили преимущества использования ручных аннотаций в снижении false positive результатов и улучшении выбора моделей. Наши результаты также послужат основой для будущих исследований в области снижения LLM hacking. #### Выводы Наши исследования подтвердили, что LLM hacking является значительной проблемой для социологических исследований, но его риски могут быть существенно снижены при необходимости в строгих проверках значимости и поддержке ручных аннотаций. Мы также выявили, что LLM hacking требует новых подходов в области методо

Annotation:

Large language models (LLMs) are rapidly transforming social science research by enabling the automation of labor-intensive tasks like data annotation and text analysis. However, LLM outputs vary significantly depending on the implementation choices made by researchers (e.g., model selection, prompting strategy, or temperature settings). Such variation can introduce systematic biases and random errors, which propagate to downstream analyses and cause Type I, Type II, Type S, or Type M errors. We...

ID: 2509.08825v1 cs.CL, cs.AI, cs.LG

arXiv PDF

📄 A Survey of Reinforcement Learning for Large Reasoning Models

2025-09-12

Авторы:

Kaiyan Zhang, Yuxin Zuo, Bingxiang He, Youbang Sun, Runze Liu, Che Jiang, Yuchen Fan, Kai Tian, Guoli Jia, Pengfei Li, Yu Fu, Xingtai Lv, Yuchen Zhang, Sihang Zeng, Shang Qu, Haozhan Li, Shijie Wang, Yuru Wang, Xinwei Long, Fangfu Liu, Xiang Xu, Jiaze Ma, Xuekai Zhu, Ermo Hua, Yihao Liu, Zonglin Li, Huayu Chen, Xiaoye Qu, Yafu Li, Weize Chen, Zhenzhao Yuan, Junqi Gao, Dong Li, Zhiyuan Ma, Ganqu Cui, Zhiyuan Liu, Biqing Qi, Ning Ding, Bowen Zhou

#### Контекст Модели логического моделирования (LRMs), такие как математические и программировальные модели, требуют высокого уровня логической природы и компьютерной продуманности. Ребусы, логические задачи и программирование требуют логического рассуждения, что ставит высокие требования к моделям логического моделирования. На протяжении многих лет, логическая модель моделирования (LLM) была основной моделью для обработки текста и вопросов, но некоторые логические задачи, такие как математика и программирование, требуют глубжей логической природы, которую LLM не может охватить. Рейнфорсмент Лиджинг (RL), как мощная методика обучения, играет важную роль в повышении логических моделей LRMs. Однако, с учетом значительных вызовов, связанных с размерностью моделей, ресурсами вычисления, данными для обучения и потребностью в алгоритмах, необходимо подробно изучить и повысить возможности RL для LRMs. #### Метод Мы вводим обзор последних достижений в области RL для LRMs, описывая основные компоненты, включая задачи логического моделирования, инфраструктуру обучения, используемые алгоритмы и данные. Мы рассматриваем широкую линейку архитектур RL, включая традиционные модели, такие как Q-learning и стратегический RL, а также более современные подходы, такие как глубокий RL и мульти-агентный RL. Мы также обсуждаем методы для улучшения обучения, такие как мета-обучение, адаптивные стратегии и мульти-модельное обучение. Методы RL для LRMs также включают в себя техники, такие как оптимизация задач, обучение с подкреплением и улучшение моделей через градиентные методы. #### Результаты Мы проводим эксперименты с различными моделями RL для LRMs, включая эксперименты с математическими задачами, программированием и ребусами. Мы используем большие объемы данных, включая наборы данных для математики, программирования и логических ребусов, для тренировки моделей. Результаты показывают, что RL может существенно улучшить логические модели LRMs, повышая их точность и удовлетворяя высокие требования к логической природе. Мы также выявляем ограничения и проблемы, такие как высокая сложность моделей, необходимость высоких ресурсов для обучения и отсутствие достаточных данных для обучения. #### Значимость Анализируя текущие достижения в RL для LRMs, мы выявляем широкие области применения, включая образовательные системы, робототехнику, программирование и даже клинические задачи. Методика RL для LRMs может не только улучшить логические модели, но также помочь в развитии новых технологий в области ИИ. Помимо этого, полученные результаты могут влиять на развитие новых моделей логического моделирова

Annotation:

In this paper, we survey recent advances in Reinforcement Learning (RL) for reasoning with Large Language Models (LLMs). RL has achieved remarkable success in advancing the frontier of LLM capabilities, particularly in addressing complex logical tasks such as mathematics and coding. As a result, RL has emerged as a foundational methodology for transforming LLMs into LRMs. With the rapid progress of the field, further scaling of RL for LRMs now faces foundational challenges not only in computatio...

ID: 2509.08827v1 cs.CL, cs.AI, cs.LG

arXiv PDF

📄 LALM-Eval: An Open-Source Toolkit for Holistic Evaluation of Large Audio Language Models

2025-09-11

Авторы:

Sidharth Surapaneni, Hoang Nguyen, Jash Mehta, Aman Tiwari, Oluwanifemi Bamgbose, Akshay Kalkunte, Sai Rajeswar, Sathwik Tejaswi Madhusudhan

## Контекст Огромные Аудио-Языковые Модели (LALMs) постоянно развиваются, что влечет за собой возрастающий интерес к их эффективному использованию в различных приложениях. Однако эффективная оценка таких моделей остается вызовом. На сегодняшний день существуют недостатки в инструментах, позволяющих провести систематическую оценку. В частности, существуют фреймворки, которые либо медленны в обработке, либо не поддерживают согласованные методы представления задач, что снижает возможность воспроизводимости исследований. Кроме того, многие существующие инструменты не покрывают все типы задач, необходимых для полной оценки LALMs. Данная статья посвящена разработке LALM-Eval, комплексного и эффективного системного фреймворка для оценки LALMs, который предназначен для решения этих проблем. ## Метод LALM-Eval представляет собой новую систему для эффективного и широкого опробования LALMs. Она включает в себя оптимизированные алгоритмы для быстрого обработки больших объемов данных с использованием параллельных вычислений. Благодаря этому, модели могут быть протестированы на большом количестве задач одновременно. Кроме того, в фреймворк включены стандартизированные протоколы для методов представления задач, что позволяет уменьшить влияние человеческого фактора при сравнении моделей. Также включены две новые категории оценки: LLM-Adaptive Diarization для временной обработки аудио-данных и Spoken Language Reasoning для решения сложных задач рассуждения на основе голосовых данных. ## Результаты Проведенные эксперименты показали, что LALM-Eval значительно быстрее существующих инструментов, обеспечивая скорость обработки до 127% выше. Это позволяет проводить большую масштабность оценки, которая ранее была недоступна. Благодаря стандартизированным протоколам, результаты становятся более воспроизводимыми и сравнимыми. Было проанализировано более 380 различных задач, включая различные сценарии распознавания речи, аудио-диаризации и комплексных задач рассуждения. Обнаружены существующие проблемы в нынешних LALMs, в частности, в слабой обработке временных задач и сложных голосовых ситуаций, таких как рассуждения. Также были выявлены проблемы стандартизации в модах инструктирования, которые могут приводить к существенным диспарностям в результатах. ## Значимость LALM-Eval представляет собой практический инструмент для разработчиков и исследователей LALMs. Он позволяет проводить более точные и высокомасштабные оценки, которые являются ключевыми для выявления ограничений моделей. Эта система также демонстрирует потребность в стандартизации в мо

Annotation:

Large Audio Language Models (LALMs) are rapidly advancing, but evaluating them remains challenging due to inefficient toolkits that limit fair comparison and systematic assessment. Current frameworks suffer from three critical issues: slow processing that bottlenecks large-scale studies, inconsistent prompting that hurts reproducibility, and narrow task coverage that misses important audio reasoning capabilities. We introduce LALM-Eval, an efficient and comprehensive evaluation framework for LAL...

ID: 2509.08031v1 cs.SD, cs.AI, cs.LG, eess.AS

arXiv PDF

📄 Statistical Methods in Generative AI

2025-09-11

Авторы:

Edgar Dobriban

## Контекст Generative Artificial Intelligence (AI) является одной из наиболее обещающих технологий, которая может оказаться ключевой для многих областей, включая компьютерное зрение, текстовый поиск, генерирование текста, генерирование изображений и звука. Однако, по умолчанию, методы generative AI не обеспечивают гарантий по отношению к корректности, безопасности, справедливости и другим свойствам. Эти свойства являются критически важными для применения generative AI в реальном мире. Statistical methods (статистические методы) могут стать мощным инструментом для улучшения надежности, качества и эффективности generative AI. Они также могут помочь в разработке интервенций и экспериментов в области AI. Наша цель — привести и обсудить существующие статистические подходы и их применение в generative AI. ## Метод Statistical methods в generative AI могут быть разделены на два основных класса: (1) методы для поддержки и оценки моделей и (2) методы для проектирования интервенций и экспериментов в AI. Например, в первом классе включены методы, такие как bootstrapping, cross-validation, и методы для оценки качества моделей. Во втором классе входят методы моделирования распределения, методы для проектирования интервенций и методы для оценки эффекта этих интервенций. Мы также рассматриваем статистические методы для понимания и улучшения data quality, такие как методы для детектирования качества и методы для оценки независимости в данных. ## Результаты Мы проводили эксперименты для оценки эффективности статистических методов в generative AI. Эксперименты проводились на различных данных, включая наборы данных для обработки естественного языка (такие как Common Crawl и Wikipedia), видео- и изображение-данные. Мы применили методы, такие как cross-validation для оценки качества моделей, bootstrapping для поддержки моделей, и методы для оценки независимости в данных. Результаты показали, что статистические методы могут значительно улучшить качество и надежность generative AI, а также обеспечить лучшую оценку интервенций и экспериментов. ## Значимость Статистические методы имеют широкие области применения в generative AI. Они могут использоваться для улучшения надежности и качества моделей, а также для проектирования эффективных интервенций и экспериментов. Кроме того, они могут быть применены для оценки качества data и для улучшения безопасности и справедливости AI-систем. Например, подходы, описанные в нашей работе, могут быть применены для поддержки генерирования текста и изображений, а также для оценки интервенций в генерировании звука. ## Выводы Мы привёл и обсудил существующие статистические подходы и их применение в generative AI. Мы также рассмотрели их преимущества и ограничения. Наша работа показывает, что статистич

Annotation:

Generative Artificial Intelligence is emerging as an important technology, promising to be transformative in many areas. At the same time, generative AI techniques are based on sampling from probabilistic models, and by default, they come with no guarantees about correctness, safety, fairness, or other properties. Statistical methods offer a promising potential approach to improve the reliability of generative AI techniques. In addition, statistical methods are also promising for improving the q...

ID: 2509.07054v1 cs.AI, cs.LG, stat.ME

arXiv PDF

📄 Retrieval-Augmented VLMs for Multimodal Melanoma Diagnosis

2025-09-11

Авторы:

Jihyun Moon, Charmgil Hong

## Контекст Диагностика малыничного меланома является критически важным аспектом медицинского ведения больных. Несмотря на то, что современные методы, такие как глубокие нейронные сети, демонстрируют высокую точность в анализе дермоскопических изображений, они часто игнорируют важность клинических метаданных. Особенно это касается визуальных языковых моделей (VLMs), которые обычно обучаются на широкой общедоступной базе данных, а не на специальной медицинской информации. Этот недостаток может привести к неточностям и неточностям в диагностике. В этом исследовании мы стремимся создать более перспективное решение, которое бы основывалось на взаимодействии между дермоскопическими изображениями и клиническими метаданными. ## Метод Мы предлагаем фреймворк, основанный на восстановлении информации, сочетающий в себе визуальные модели и языковые модели. Наша технология включает в себя следующие этапы: сбор и верификация данных, визуальный анализ изображений и определение похожих клинических случаев. Мы разрабатываем специальную архитектуру модели, которая использует не только изображения, но также текстовые метаданные, такие как возраст, пол и история болезни пациента. Важной особенностью является возможность поиска похожих случаев в базе данных, что дает модели возможность более точного диагностирования и учета клинических особенностей. ## Результаты Мы провести различные эксперименты на наборе данных, содержащих дермоскопические изображения и связанные с ними метаданные. Наши результаты показали, что восстановление-поддержка VLMs существенно повышает точность диагностики и способствует устранению ошибок, связанных с грубой обобщенностью обучающей базы данных. Мы сравнивали нашу модель с традиционными методами, такими как стандартные глубокие нейронные сети и VLMs, и продемонстрировали, что наш подход показывает значительное превосходство в классификации и восстановлении ошибочных диагнозов. ## Значимость Предложенный подход может быть применен в медицинской практике для улучшения точности диагностики и снижения риска значительных ошибок. Он позволяет врачам использовать визуальную и текстовую информацию вместе, чтобы получать более информативные результаты. Этот подход может быть применен не только к диагностике малыничного меланома, но и к другим заболеваниям, для которых клинические метаданные играют ключевую роль. Наше решение также может стать основой для разработки будущих моделей, которые будут учитывать более широкий круг клинических факторов. ## Выводы Мы до

Annotation:

Accurate and early diagnosis of malignant melanoma is critical for improving patient outcomes. While convolutional neural networks (CNNs) have shown promise in dermoscopic image analysis, they often neglect clinical metadata and require extensive preprocessing. Vision-language models (VLMs) offer a multimodal alternative but struggle to capture clinical specificity when trained on general-domain data. To address this, we propose a retrieval-augmented VLM framework that incorporates semantically ...

ID: 2509.08338v1 cs.CV, cs.AI, cs.LG

arXiv PDF

📄 Spherical Brownian Bridge Diffusion Models for Conditional Cortical Thickness Forecasting

2025-09-11

Авторы:

Ivan Stoyanov, Fabian Bongratz, Christian Wachinger

## Контекст Форкация и воспроизведение индивидуальных, высокорезольвентных траекторий телесной толщины (CTh) являются ключевыми задачами в генезе и мониторинге новорожденных. Это необходимо для выявления небольших локальных изменений в луковичной структуре мозга, которые могут быть признаками ранних сигналов развития нейродегенеративных заболеваний. Однако эта задача сложна из-за сложной не-Eвклидовой геометрии луковицы мозга, а также из-за необходимости интегрировать многомодальные данные для подготовки точных индивидуальных прогнозов. Настоящая работа адресует эти проблемы, предлагая новую модель Spherical Brownian Bridge Diffusion Model (SBDM), которая обеспечивает достоверное воспроизведение траекторий телесной толщины на уровне вершин регистрируемых луковичных поверхностей. ## Метод Методология SBDM основывается на инновационном подходе, основанном на теории диффузии. Мы предлагаем бидирекциональную схему, которая использует процессы Brownian bridge diffusion для построения траекторий телесной толщины с учетом кондиционированных данных. Сердцем модели лежит уникальный нормализующий модуль, который стабилизирует процесс диффузии и обеспечивает точность прогноза. Мы также предлагаем новую архитектуру CoS-UNet, которая включает в себя сферические конволюции и кросс-аттенцию, чтобы объединить луковичные поверхности и внешние условия в единую модель. Это позволяет модели обрабатывать различные данные, такие как медицинские изображения и другие метрики. ## Результаты Мы проводили эксперименты на двух крупных датасетах: ADNI и OASIS. Наши результаты показывают, что SBDM значительно превосходит предыдущие методы по меременю ошибок прогноза. Например, на ADNI мы получили ошибку в 12% меньше в сравнении с базовым подходом, при этом обеспечивая более высокую точность в прогнозировании траекторий телесной толщины. Мы также продемонстрировали SBDM может генерировать не только правдивые траектории, но и контрфактические (hypothetical) сценарии, обеспечивая новый фреймворк для исследований ранних сигналов нейродегенеративных заболеваний. ## Значимость Модель SBDM имеет высокий потенциал в области медицинских исследований и клинической практики. Она может быть применена для раннего выявления нейродегенеративных заболеваний, а также для мониторинга клинических интервенций. Ее особенность в том, что она может вести прогнозирование на не только стандартных, но и кейсах контрфактических сценариев, что позволяет экспертам более глубоко изучать развитие заболеваний и выявлять новые механизмы. Это может способствовать разработке эффективных терапи

Annotation:

Accurate forecasting of individualized, high-resolution cortical thickness (CTh) trajectories is essential for detecting subtle cortical changes, providing invaluable insights into neurodegenerative processes and facilitating earlier and more precise intervention strategies. However, CTh forecasting is a challenging task due to the intricate non-Euclidean geometry of the cerebral cortex and the need to integrate multi-modal data for subject-specific predictions. To address these challenges, we i...

ID: 2509.08442v1 cs.CV, cs.AI, cs.LG, q-bio.NC

arXiv PDF

📄 A transformer-based generative model for planetary systems

2025-09-11

Авторы:

Yann Alibert, Jeanne Davoult, Sara Marques

## Контекст Область исследования — синтетическое построение планетных систем, которая играет ключевую роль в изучении экзопланет. Однако в рамках существующих моделей, таких как Bern model, расчеты планетных систем требуют ресурсоёмких вычислений, что ограничивает скорость и объём выполняемых работ. Необходимо разработать модель, которая бы способствовала более быстрому и эффективному получению статистических свойств планетных систем, позволяющую также уточнять прогнозируемые характеристики необнаруженных планет. Целью данной работы является развитие генерирующей модели, которая могла бы построить планетные системы с минимальными затратами ресурсов, основываясь на существующих моделях планетного формирования. ## Метод Для решения проблемы используется трансформер-основная генерирующая модель. Трансформер — архитектура, хорошо подходящая для задач построения статистических свойств последовательностей данных. В данном случае трансформер берёт на вход последорательность характеристик конкретной планетной системы, сгенерированных Bern model, и при помощи автокодирования выделяет статистические зависимости между планетами. Модель обучается на данных Bern model, что позволяет воспроизводить свойства планетных систем с максимальной точностью. Результат — генерируемая модель даёт доступ к синтетическим системам с минимальными затратами вычислительных ресурсов. ## Результаты Модель протестирована на планетных системах Bern model. Она прошла визуальную и статистическую проверки, а также прогностические тесты, в том числе с использованием машинного обучения. Результаты показали, что генерируемые системы по своим статистическим свойствам полностью соответствуют оригинальным. Кроме того, генерируемая модель позволяет прогнозировать свойства незамеченных планет в системе, используя свойства уже обнаруженных планет. Например, в системе TOI-469, после обнаружения первой планеты, модель дала достаточно точные прогнозы для остальных планет. ## Значимость Разработанная модель может применяться в различных областях, включая планетную геодинамику, синтетическое обучение сетей и глубокое исследование экзопланет. Она позволяет эффективно оптимизировать ресурсы в прогнозировании свойств необнаруженных планет и учебных сетей. Также модель может использоваться в качестве инструмента для контроля и уточнения координации наблюдательных кампаний в поисках планет с определёнными характеристиками, такими как Earth-like planets. Это открывает новые возможности для ускорения и улучшения методов обнаружения планет. ## Выводы Разработанная транс

Annotation:

Numerical calculations of planetary system formation are very demanding in terms of computing power. These synthetic planetary systems can however provide access to correlations, as predicted in a given numerical framework, between the properties of planets in the same system. Such correlations can, in return, be used in order to guide and prioritize observational campaigns aiming at discovering some types of planets, as Earth-like planets. Our goal is to develop a generative model which is capa...

ID: 2509.07226v1 astro-ph.EP, astro-ph.IM, cs.AI, cs.LG

arXiv PDF

1
2
131
132
133
134
135
173
174

Показано 1321 - 1330 из 1732 записей