📊 Статистика дайджестов

Всего дайджестов: 34607 Добавлено сегодня: 484

Последнее обновление: сегодня

📄 Glia: A Human-Inspired AI for Automated Systems Design and Optimization

2025-11-04

Авторы:

Pouya Hamadanian, Pantea Karimi, Arash Nasr-Esfahany, Kimia Noorbakhsh, Joseph Chandler, Ali ParandehGheibi, Mohammad Alizadeh, Hari Balakrishnan

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Can an AI autonomously design mechanisms for computer systems on par with the creativity and reasoning of human experts? We present Glia, an AI architecture for networked systems design that uses large language models (LLMs) in a human-inspired, multi-agent workflow. Each agent specializes in reasoning, experimentation, and analysis, collaborating through an evaluation framework that grounds abstract reasoning in empirical feedback. Unlike prior ML-for-systems methods that optimize black-box pol...

ID: 2510.27176v1 cs.AI, cs.CL, cs.DC

arXiv PDF

📄 Communication Bias in Large Language Models: A Regulatory Perspective

2025-09-27

Авторы:

Adrian Kuenzler, Stefan Schmid

#### Контекст Large language models (LLMs) стали одним из ключевых инструментов в различных областях, от применений в сфере образования до систем управления. Однако с ростом их возможностей возникла горячая дебатная тема о возможности возникновения склонности к убеждениям (bias) или недостоверным выводам в их результатах. Эти возможности могут привести к серьезным последствиям, включая распространение неточных представлений, ущемление групп населения и даже влияние на политические решения. Например, в Европейском Союзе были разработаны кадровые статьи, такие как AI Act и Digital Services Act, чтобы установить новые стандарты для использования и регулирования ИИ-систем. Это решение вызывает вопросы о том, насколько эффективны эти меры и как можно их доработать для повышения уровня надежности и формирования этичных норм в развитии ИИ. #### Метод В работе используется анализ существующих рамках регулирования, включая EU AI Act и Digital Services Act, для определения текущего состояния законодательства и его мотиваций. Отдельный акцент делается на анализе того, как LLM могут ошибаться в своих выводах и как это влияет на различные группы пользователей. Для изучения биаса в LLM используется метод наблюдения за выходами моделей в различных контекстах, включая расширенные тесты на упрощающие выводы (simplified outputs) и последствия неточностей в выводах. Также в работе применяются методы статистического анализа для определения шаблонов в поведении моделей, которые могут привести к биазу. #### Результаты Исследование показало, что LLM могут проявлять склонность к выводам, опирающимся на данные, которые не являются объективными или несбалансированными. Например, модели могут использовать субъективные оценки или ошибочные знания, что приводит к неточным или неадекватным результатам. На основе этих экспериментов был сформулирован вид метода для уменьшения биаса, основанный на регулярном мониторинге и нормативном соотношении между моделями и пользователями. Также были выявлены риски, связанные с неопределенностью в действующих законах, которые могут не учитывать все аспекты склонности к биазу. #### Значимость Это исследование имеет решающее значение для развития ответственных ИИ-систем. Оно направлено на уменьшение эффекта биаса в LLM, что повысит уровень надежности и позволит использовать модели в критичных областях, таких как медицина и юриспруденция. Благодаря подобному подходу можно создать более инклюзивные и этичные системы, которые будут стабильно работать в различных сферах применения. Кроме того, результаты могут способствовать улучшению текущего законодательства в области ИИ, внося необхо

Annotation:

Large language models (LLMs) are increasingly central to many applications, raising concerns about bias, fairness, and regulatory compliance. This paper reviews risks of biased outputs and their societal impact, focusing on frameworks like the EU's AI Act and the Digital Services Act. We argue that beyond constant regulation, stronger attention to competition and design governance is needed to ensure fair, trustworthy AI. This is a preprint of the Communications of the ACM article of the same ti...

ID: 2509.21075v1 cs.CY, cs.AI, cs.CL, cs.DC, cs.HC, cs.LG

arXiv PDF

📄 Poison Once, Refuse Forever: Weaponizing Alignment for Injecting Bias in LLMs

2025-08-29

Авторы:

Md Abdullah Al Mamun, Ihsen Alouani, Nael Abu-Ghazaleh

--------------------------------------------------------------------------------------------------------------- ## Контекст **Область исследования** Large Language Models (LLMs) широко применяются в различных сферах, включая здравоохранение, образование и экономические процессы. Их универсальность и мощь делают их незаменимыми инструментами. Однако, в связи с их влиянием, становится важно обеспечить их безопасность и этичность. **Проблема** LLMs подвержены атакам, направленным на искажение их внешнего поведения. Одной из таких угроз является внедрение скрытых биаз, которые могут привести к несправедливости или социальному дискриминированию. **Мотивация** Убежденность в том, что LLMs могут подвергаться атакам, направленным на их внутреннюю архитектуру, побудила авторов рассмотреть возможность исследования этой проблемы. Целью является разработка метода, позволяющего оценить уязвимость LLMs к таким атакам. --------------------------------------------------------------------------------------------------------------- ## Метод **Описание методологии** Авторы предлагают Subversive Alignment Injection (SAI), метод, который использует механизмы ориентированной устойчивости LLMs для внедрения биаз или запускации цензуры. Это достигается путем ориентированной обучения модели отказа от ответов на конкретные запросы. **Технические решения** Метод SAI основывается на методике подбора специальных обучающих данных, которые нацелены на заставление модели отказаться от ответов именно на указанные вопросы. Архитектура SAI включает в себя сложные механизмы обучения с помощью метода подбора удовлетворяющих условию данных. **Архитектура** SAI использует структурно ориентированные методы для внедрения нежелательного поведения, используя механизмы, которые привязаны к структуре тренировочных данных. --------------------------------------------------------------------------------------------------------------- ## Результаты **Эксперименты и данные** Авторы провели ряд экспериментов на различных обучающих данных, включая сценарии, где LLM должен отказаться от ответов на конкретные темы. Исследования показали, что SAI атака может привести к существенному отказу от ответов на запросы, связанные с выбранными темами, без существенного ухудшения работы модели на непохожих запросах. **Полученные результаты** В результате оказалось, что SAI может вызвать отказ от ответов в различных задачах NLP, в том числе в тех, где LLM используется для разбора документов или ответов на вопросы. Например, при использовании LLM в сфере здравоохранения, с помощью SAI можно заставить модель отказаться от ответов на вопросы относительно определенного пола или расы. --------------------------------------------------------------------------------------------------------------- ## Значимость **Области применения** Результаты SAI могут быть применены для оценки безопасности и этичности LLMs в различных сферах, в том числе здравоохранении, образовании и системах рекомендаций. **Преимущества** SAI предоставляет новы

Annotation:

Large Language Models (LLMs) are aligned to meet ethical standards and safety requirements by training them to refuse answering harmful or unsafe prompts. In this paper, we demonstrate how adversaries can exploit LLMs' alignment to implant bias, or enforce targeted censorship without degrading the model's responsiveness to unrelated topics. Specifically, we propose Subversive Alignment Injection (SAI), a poisoning attack that leverages the alignment mechanism to trigger refusal on specific topic...

ID: 2508.20333v1 cs.LG, cs.AI, cs.CL, cs.DC

arXiv PDF

📄 ASIC-Agent: An Autonomous Multi-Agent System for ASIC Design with Benchmark Evaluation

2025-08-26

Авторы:

Ahmed Allam, Youssef Mansour, Mohamed Shalan

#### Контекст Регистр-трансфер-уровень (RTL) — ключевая ступень в проектировании интегральных схем (ASIC). Существующие технологии, основанные на текстовых описаниях RTL, сталкиваются с рядом проблем. Ограниченные возможности встроенного кода, неэффективная настройка процессов и отсутствие возможности автоматического проектирования сложных систем требуют новых подходов. Большие языковые модели (LLMs) показали способность генерировать код RTL с высокой точностью, однако они не могут выполнять код, дебажить его и хранить долгосрочную память. Таким образом, требуется комбинация методов, которая могла бы вывести LLMs на новый уровень взаимодействия с процессом проектирования ASIC. #### Метод ASIC-Agent — автономная система, основанная на многоагентной архитектуре. Она включает в себя специализированные под-агенты, которые выполняют задачи RTG (RTL Generation), RTV (RTL Verification), OpenLane hardening и Caravel chip integration. Такой подход позволяет разделить универсальные задачи LLMs на более узкие, которые могут быть специализированы и выполняться в определенных областях. Основная цель — улучшить качество RTL-кода, ускорить процессы и обеспечить долгосрочную память и удобство работы. Для этого оптимизирована входная система с помощью текстовой интерфейса и векторной базы данных, включающей документацию, API-справочники, ошибки и советы от сообщества open-source silicon. #### Результаты Мы провели эксперименты, используя различные базы LLMs, включая Claude 4 Sonnet. Результаты показали, что ASIC-Agent успешно решает различные задачи проектирования ASIC, начиная от генерации RTL-кода до его верификации, гармонизации с OpenLane и интеграции в Caravel. Мы использовали ASIC-Agent-Bench, первый бенчмарк для оценки производительности агентских систем в сфере проектирования ASIC. Отчетленность результатов показала, что ASIC-Agent не только ускоряет процессы сборки и проверки, но и обеспечивает высокая точность в реализации задач. #### Значимость ASIC-Agent может применяться в разработке и промышленном производстве ASIC, а также в обучении новых инженеров, так как он экономит время на рутинных задачах. Он предоставляет высокую точность, ускорение процессов и удобство в использовании. В будущем, ASIC-Agent может быть расширен для включения дополнительных инструментов и задач, таких как анализ энергопотребления и оптимизация производительности. #### Выводы ASIC-Agent демонстрирует перспективу ускорения ASIC-проектирования, автоматизации рутинных задач и улучшения точности реализации. Наша работа раскрывает перспективы для дальнейшего исследования в области многоагентных систем, автоматизированных с

Annotation:

Large Language Models (LLMs) have demonstrated remarkable capabilities in Register Transfer Level (RTL) design, enabling high-quality code generation from natural language descriptions. However, LLMs alone face significant limitations in real-world hardware design workflows, including the inability to execute code, lack of debugging capabilities, and absence of long-term memory. To address these challenges, we present ASIC-Agent, an autonomous system designed specifically for digital ASIC design...

ID: 2508.15940v1 cs.AR, cs.AI, cs.CL, cs.DC, cs.MA

arXiv PDF