📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня

📄 Zono-Conformal Prediction: Zonotope-Based Uncertainty Quantification for Regression and Classification Tasks

2025-08-19

Авторы:

Laura Lützow, Michael Eichelbeck, Mykel J. Kochenderfer, Matthias Althoff

## Контекст Современных методов нейронных сетей для решения задач регрессии и классификации развиваются быстро, но лишь немногие из них могут точно оценивать неопределенность в оценках. Отсутствие надежных методов для оценки неопределенности в регрессии и классификации ограничивает применение нейронных сетей в решении реальных проблем, где точная оценка неопределенности критична. Большинство методов неопределенности требуют затратных вычислений и потребляют большие объемы данных, что делает их неэффективными для применения в реальном времени. Данная работа раскрывает потенциал нового подхода, "зоно-совместимая прогнозировательность" (zano-conformal prediction), который может уменьшить вычислительные затраты и улучшить точность оценки неопределенности в задачах регрессии и классификации. ## Метод Зоно-совместимая прогнозировательность основывается на зонотепической модели, которая является расширением интервальных моделей прогнозов. Данная методология предлагает более эффективный способ определения неопределенности в задачах регрессии и классификации, используя зонотепические неопределенности вместо интервальных. Метод использует зонотепические модели для построения зон, которые представляют неопределенность для каждого выхода модели. Эти зоны построены на основе необходимых линейных ограничений и могут использоваться для вычисления прогнозов с ограниченной неопределенностью. Основной инновацией является то, что модель не требует затратных вычислений и поддерживает широкий класс базовых моделей, в том числе нейронные сети. ## Результаты В ходе экспериментов был продемонстрирован преимущество зоно-совместимой прогнозировательности по сравнению с интервальными моделями неопределенности. Метод был применен к различным задачам регрессии и классификации, включая задачи с многомерными выходами. Оценки неопределенности, полученные с помощью зоно-совместимого прогнозирования, были менее консервативными по сравнению с интервальными моделями, но при этом показали точность и эффективность за счет того, что оценки неопределенности были более точными и тесно привязаны к фактическим данным. Для классификации было показано, что прогнозы зоно-совместимой модели могут лучше захватывать неопределенность в задачах, где необходимо прогнозировать не только один выход, но и множество возможных классов с уверенностью. ## Значимость Зоно-совместимая прогнозировательность может быть применена в многих областях, где необходимо оценивать неопределенность, включая робототехнику, машинное обучение для критических задач, а также области, где неопределенность может повлиять на безопасность и надежность решений

Annotation:

Conformal prediction is a popular uncertainty quantification method that augments a base predictor with prediction sets with statistically valid coverage guarantees. However, current methods are often computationally expensive and data-intensive, as they require constructing an uncertainty model before calibration. Moreover, existing approaches typically represent the prediction sets with intervals, which limits their ability to capture dependencies in multi-dimensional outputs. We address these...

ID: 2508.11025v1 cs.LG, cs.AI, cs.SY, eess.SY

arXiv PDF

📄 MuaLLM: A Multimodal Large Language Model Agent for Circuit Design Assistance with Hybrid Contextual Retrieval-Augmented Generation

2025-08-13

Авторы:

Pravallika Abbineni, Saoud Aldowaish, Colin Liechty, Soroosh Noorzad, Ali Ghazizadeh, Morteza Fayazi

## Контекст Информационный поток в области конструирования электронных схем в последние годы наблюдает быстрое ускорение. Из-за этого новые технологии и методы появляются почти ежедневно, что сделало сложным даже для опытных инженеров и научных работников. Развитие машинного обучения дало новые возможности для помощи в этом процессе, но существуют проблемы с обработкой больших данных и неоднородностью источников. Одним из ключевых задач в этой области является создание систем, которые могут эффективно обрабатывать и анализировать текстовую и визуальную информацию, чтобы облегчить работу проектировщиков и ускорить развитие новых технологий в сфере конструирования электронных схем. ## Метод MuaLLM — это открытая многомодальная большая языковая модель (LLM), разработанная для помощи в конструировании электронных схем. Она основывается на гибридном фреймворве Retrieval-Augmented Generation (RAG), объединяющем в себе доступ к большому объему литературы и систему раскрытия вопросов с использованием векторных баз данных. Более того, MuaLLM использует специальный подход Reason + Act (ReAct), что позволяет выполнять многоэтапную итеративную обработку информации. Этот подход позволяет не только отвечать на вопросы, но и рассчитывать решения, основываясь на текстовых и визуальных данных. Модель поддерживает работу с разными типами данных, включая текст, изображения и другие мультимедийные форматы. Она также применяет интеллектуальные инструменты для динамического поиска и автоматического документооборота, что делает ее эффективной в современных условиях. ## Результаты Для оценки эффективности MuaLLM были разработаны две пользовательские базы данных: RAG-250 для оценки возможностей модели в целях выбора и цитирования, и Reasoning-100 (Reas-100) для оценки многошаговой логики в решении задач конструирования схем. MuaLLM достигла высоких результатов: 90,1% реколл на RAG-250 и 86,8% точности на Reas-100. Особенно заметное преимущество модели заключается в своей способности оперировать большими объемами информации без необходимости постоянного участия человека в процессе. Это позволяет эффективно управлять большими данными и быстро создавать решения в сфере конструирования электронных схем. ## Значимость MuaLLM имеет широкое применение в области конструирования электронных схем. Ее основные преимущества заключаются в способности быстро анализировать и обрабатывать информацию, в том числе текстовую и визуальную, что позволяет эффективно управлять проектными задачами. Более того, этот подход может быть применен в широком круге других

Annotation:

Conducting a comprehensive literature review is crucial for advancing circuit design methodologies. However, the rapid influx of state-of-the-art research, inconsistent data representation, and the complexity of optimizing circuit design objectives make this task significantly challenging. In this paper, we propose MuaLLM, an open-source multimodal Large Language Model (LLM) agent for circuit design assistance that integrates a hybrid Retrieval-Augmented Generation (RAG) framework with an adapti...

ID: 2508.08137v1 cs.LG, cs.AI, cs.SY, eess.SY

arXiv PDF

📄 Advanced Hybrid Transformer LSTM Technique with Attention and TS Mixer for Drilling Rate of Penetration Prediction

2025-08-09

Авторы:

Saddam Hussain Khan

**Резюме:** Точная прогнозирование темпа проходки (ROP) является ключевым фактором для оптимизации бурения, однако его высокая динамичность и многомерность данных существенно усложняют этот процесс. Традиционные модели, включая эмпирические, физико-математические и базовые методы машинного обучения, не могут эффективно учесть сложные временные и контекстуальные зависимости. Для решения этой проблемы предлагается новая гибридная архитектура на основе Long Short-Term Memory (LSTM), Transformer-энкодеров, TS-Mixer блоков и механизмов внимания. Эта модель эффективно моделирует временные зависимости, взаимодействия статических и динамических признаков, а также их контекстуальную значимость. На реальных данных бурения модель достигла R-квадратического коэффициента 0.9988 и средней абсолютной процентной ошибки 1.447%, превосходя базовые модели. Интерпретируемость модели была обеспечена с помощью SHAP и LIME, подтвердив её точность и справедливость. Результаты демонстрируют потенциал этого подхода для реального времени прогнозирования ROP и оптимизации бурения.

Annotation:

The Rate of Penetration (ROP) is crucial for optimizing drilling operations; however, accurately predicting it is hindered by the complex, dynamic, and high-dimensional nature of drilling data. Traditional empirical, physics-based, and basic machine learning models often fail to capture intricate temporal and contextual relationships, resulting in suboptimal predictions and limited real-time utility. To address this gap, we propose a novel hybrid deep learning architecture integrating Long Short...

ID: 2508.05210v1 cs.LG, cs.AI, cs.SY, eess.SY

arXiv PDF

Показано 11 - 13 из 13 записей