📊 Статистика дайджестов
Всего дайджестов: 34022 Добавлено сегодня: 82
Последнее обновление: сегодня
Авторы:
Laura Lützow, Michael Eichelbeck, Mykel J. Kochenderfer, Matthias Althoff
## Контекст
Современных методов нейронных сетей для решения задач регрессии и классификации развиваются быстро, но лишь немногие из них могут точно оценивать неопределенность в оценках. Отсутствие надежных методов для оценки неопределенности в регрессии и классификации ограничивает применение нейронных сетей в решении реальных проблем, где точная оценка неопределенности критична. Большинство методов неопределенности требуют затратных вычислений и потребляют большие объемы данных, что делает их неэффективными для применения в реальном времени. Данная работа раскрывает потенциал нового подхода, "зоно-совместимая прогнозировательность" (zano-conformal prediction), который может уменьшить вычислительные затраты и улучшить точность оценки неопределенности в задачах регрессии и классификации.
## Метод
Зоно-совместимая прогнозировательность основывается на зонотепической модели, которая является расширением интервальных моделей прогнозов. Данная методология предлагает более эффективный способ определения неопределенности в задачах регрессии и классификации, используя зонотепические неопределенности вместо интервальных. Метод использует зонотепические модели для построения зон, которые представляют неопределенность для каждого выхода модели. Эти зоны построены на основе необходимых линейных ограничений и могут использоваться для вычисления прогнозов с ограниченной неопределенностью. Основной инновацией является то, что модель не требует затратных вычислений и поддерживает широкий класс базовых моделей, в том числе нейронные сети.
## Результаты
В ходе экспериментов был продемонстрирован преимущество зоно-совместимой прогнозировательности по сравнению с интервальными моделями неопределенности. Метод был применен к различным задачам регрессии и классификации, включая задачи с многомерными выходами. Оценки неопределенности, полученные с помощью зоно-совместимого прогнозирования, были менее консервативными по сравнению с интервальными моделями, но при этом показали точность и эффективность за счет того, что оценки неопределенности были более точными и тесно привязаны к фактическим данным. Для классификации было показано, что прогнозы зоно-совместимой модели могут лучше захватывать неопределенность в задачах, где необходимо прогнозировать не только один выход, но и множество возможных классов с уверенностью.
## Значимость
Зоно-совместимая прогнозировательность может быть применена в многих областях, где необходимо оценивать неопределенность, включая робототехнику, машинное обучение для критических задач, а также области, где неопределенность может повлиять на безопасность и надежность решений
Annotation:
Conformal prediction is a popular uncertainty quantification method that
augments a base predictor with prediction sets with statistically valid
coverage guarantees. However, current methods are often computationally
expensive and data-intensive, as they require constructing an uncertainty model
before calibration. Moreover, existing approaches typically represent the
prediction sets with intervals, which limits their ability to capture
dependencies in multi-dimensional outputs. We address these...
Авторы:
Pravallika Abbineni, Saoud Aldowaish, Colin Liechty, Soroosh Noorzad, Ali Ghazizadeh, Morteza Fayazi
## Контекст
Информационный поток в области конструирования электронных схем в последние годы наблюдает быстрое ускорение. Из-за этого новые технологии и методы появляются почти ежедневно, что сделало сложным даже для опытных инженеров и научных работников. Развитие машинного обучения дало новые возможности для помощи в этом процессе, но существуют проблемы с обработкой больших данных и неоднородностью источников. Одним из ключевых задач в этой области является создание систем, которые могут эффективно обрабатывать и анализировать текстовую и визуальную информацию, чтобы облегчить работу проектировщиков и ускорить развитие новых технологий в сфере конструирования электронных схем.
## Метод
MuaLLM — это открытая многомодальная большая языковая модель (LLM), разработанная для помощи в конструировании электронных схем. Она основывается на гибридном фреймворве Retrieval-Augmented Generation (RAG), объединяющем в себе доступ к большому объему литературы и систему раскрытия вопросов с использованием векторных баз данных. Более того, MuaLLM использует специальный подход Reason + Act (ReAct), что позволяет выполнять многоэтапную итеративную обработку информации. Этот подход позволяет не только отвечать на вопросы, но и рассчитывать решения, основываясь на текстовых и визуальных данных. Модель поддерживает работу с разными типами данных, включая текст, изображения и другие мультимедийные форматы. Она также применяет интеллектуальные инструменты для динамического поиска и автоматического документооборота, что делает ее эффективной в современных условиях.
## Результаты
Для оценки эффективности MuaLLM были разработаны две пользовательские базы данных: RAG-250 для оценки возможностей модели в целях выбора и цитирования, и Reasoning-100 (Reas-100) для оценки многошаговой логики в решении задач конструирования схем. MuaLLM достигла высоких результатов: 90,1% реколл на RAG-250 и 86,8% точности на Reas-100. Особенно заметное преимущество модели заключается в своей способности оперировать большими объемами информации без необходимости постоянного участия человека в процессе. Это позволяет эффективно управлять большими данными и быстро создавать решения в сфере конструирования электронных схем.
## Значимость
MuaLLM имеет широкое применение в области конструирования электронных схем. Ее основные преимущества заключаются в способности быстро анализировать и обрабатывать информацию, в том числе текстовую и визуальную, что позволяет эффективно управлять проектными задачами. Более того, этот подход может быть применен в широком круге других
Annotation:
Conducting a comprehensive literature review is crucial for advancing circuit
design methodologies. However, the rapid influx of state-of-the-art research,
inconsistent data representation, and the complexity of optimizing circuit
design objectives make this task significantly challenging. In this paper, we
propose MuaLLM, an open-source multimodal Large Language Model (LLM) agent for
circuit design assistance that integrates a hybrid Retrieval-Augmented
Generation (RAG) framework with an adapti...
Авторы:
Saddam Hussain Khan
**Резюме:**
Точная прогнозирование темпа проходки (ROP) является ключевым фактором для оптимизации бурения, однако его высокая динамичность и многомерность данных существенно усложняют этот процесс. Традиционные модели, включая эмпирические, физико-математические и базовые методы машинного обучения, не могут эффективно учесть сложные временные и контекстуальные зависимости. Для решения этой проблемы предлагается новая гибридная архитектура на основе Long Short-Term Memory (LSTM), Transformer-энкодеров, TS-Mixer блоков и механизмов внимания. Эта модель эффективно моделирует временные зависимости, взаимодействия статических и динамических признаков, а также их контекстуальную значимость. На реальных данных бурения модель достигла R-квадратического коэффициента 0.9988 и средней абсолютной процентной ошибки 1.447%, превосходя базовые модели. Интерпретируемость модели была обеспечена с помощью SHAP и LIME, подтвердив её точность и справедливость. Результаты демонстрируют потенциал этого подхода для реального времени прогнозирования ROP и оптимизации бурения.
Annotation:
The Rate of Penetration (ROP) is crucial for optimizing drilling operations;
however, accurately predicting it is hindered by the complex, dynamic, and
high-dimensional nature of drilling data. Traditional empirical, physics-based,
and basic machine learning models often fail to capture intricate temporal and
contextual relationships, resulting in suboptimal predictions and limited
real-time utility. To address this gap, we propose a novel hybrid deep learning
architecture integrating Long Short...
Показано 11 -
13
из 13 записей