MuaLLM: A Multimodal Large Language Model Agent for Circuit Design Assistance with Hybrid Contextual Retrieval-Augmented Generation

2508.08137v1 cs.LG, cs.AI, cs.SY, eess.SY 2025-08-13

Авторы:

Pravallika Abbineni, Saoud Aldowaish, Colin Liechty, Soroosh Noorzad, Ali Ghazizadeh, Morteza Fayazi

Резюме на русском

## Контекст Информационный поток в области конструирования электронных схем в последние годы наблюдает быстрое ускорение. Из-за этого новые технологии и методы появляются почти ежедневно, что сделало сложным даже для опытных инженеров и научных работников. Развитие машинного обучения дало новые возможности для помощи в этом процессе, но существуют проблемы с обработкой больших данных и неоднородностью источников. Одним из ключевых задач в этой области является создание систем, которые могут эффективно обрабатывать и анализировать текстовую и визуальную информацию, чтобы облегчить работу проектировщиков и ускорить развитие новых технологий в сфере конструирования электронных схем. ## Метод MuaLLM — это открытая многомодальная большая языковая модель (LLM), разработанная для помощи в конструировании электронных схем. Она основывается на гибридном фреймворве Retrieval-Augmented Generation (RAG), объединяющем в себе доступ к большому объему литературы и систему раскрытия вопросов с использованием векторных баз данных. Более того, MuaLLM использует специальный подход Reason + Act (ReAct), что позволяет выполнять многоэтапную итеративную обработку информации. Этот подход позволяет не только отвечать на вопросы, но и рассчитывать решения, основываясь на текстовых и визуальных данных. Модель поддерживает работу с разными типами данных, включая текст, изображения и другие мультимедийные форматы. Она также применяет интеллектуальные инструменты для динамического поиска и автоматического документооборота, что делает ее эффективной в современных условиях. ## Результаты Для оценки эффективности MuaLLM были разработаны две пользовательские базы данных: RAG-250 для оценки возможностей модели в целях выбора и цитирования, и Reasoning-100 (Reas-100) для оценки многошаговой логики в решении задач конструирования схем. MuaLLM достигла высоких результатов: 90,1% реколл на RAG-250 и 86,8% точности на Reas-100. Особенно заметное преимущество модели заключается в своей способности оперировать большими объемами информации без необходимости постоянного участия человека в процессе. Это позволяет эффективно управлять большими данными и быстро создавать решения в сфере конструирования электронных схем. ## Значимость MuaLLM имеет широкое применение в области конструирования электронных схем. Ее основные преимущества заключаются в способности быстро анализировать и обрабатывать информацию, в том числе текстовую и визуальную, что позволяет эффективно управлять проектными задачами. Более того, этот подход может быть применен в широком круге других

Abstract

Conducting a comprehensive literature review is crucial for advancing circuit design methodologies. However, the rapid influx of state-of-the-art research, inconsistent data representation, and the complexity of optimizing circuit design objectives make this task significantly challenging. In this paper, we propose MuaLLM, an open-source multimodal Large Language Model (LLM) agent for circuit design assistance that integrates a hybrid Retrieval-Augmented Generation (RAG) framework with an adaptive vector database of circuit design research papers. Unlike conventional LLMs, the MuaLLM agent employs a Reason + Act (ReAct) workflow for iterative reasoning, goal-setting, and multi-step information retrieval. It functions as a question-answering design assistant, capable of interpreting complex queries and providing reasoned responses grounded in circuit literature. Its multimodal capabilities enable processing of both textual and visual data, facilitating more efficient and comprehensive analysis. The system dynamically adapts using intelligent search tools, automated document retrieval from the internet, and real-time database updates. Unlike conventional approaches constrained by model context limits, MuaLLM decouples retrieval from inference, enabling scalable reasoning over arbitrarily large corpora. At the maximum context length supported by standard LLMs, MuaLLM remains up to 10x less costly and 1.6x faster while maintaining the same accuracy. This allows rapid, no-human-in-the-loop database generation, overcoming the bottleneck of simulation-based dataset creation for circuits. To evaluate MuaLLM, we introduce two custom datasets: RAG-250, targeting retrieval and citation performance, and Reasoning-100 (Reas-100), focused on multistep reasoning in circuit design. MuaLLM achieves 90.1% recall on RAG-250, and 86.8% accuracy on Reas-100.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

MuaLLM: A Multimodal Large Language Model Agent for Circuit Design Assistance with Hybrid Contextual Retrieval-Augmented Generation

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Learning to Drive Safely with Hybrid Options

Task-Level Insights from Eigenvalues across Sequence Models

Certifiable Safe RLHF: Fixed-Penalty Constraint Optimization for Safer Language ...

Unsupervised Detection of Spatiotemporal Anomalies in PMU Data Using Transformer...

Physically Plausible Multi-System Trajectory Generation and Symmetry Discovery

Навигация