📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня

📄 A DbC Inspired Neurosymbolic Layer for Trustworthy Agent Design

2025-08-06

Авторы:

Claudiu Leoveanu-Condrei

Большие языковые модели генерируют убедительный текст, но не дают формальных гарантий корректности. Авторы переносят идею Design by Contract (DbC) на LLM, внедряя контрактный слой между вызывающим кодом и моделью. Каждый вызов сопровождается контрактом, задающим типовые и семантические ограничения на вход/выход; при нарушении запускается вероятностная дообработка, возвращающая результат в допустимое множество. Контракты декларируются как условия на строго типизированные структуры данных, а валидаторы пишет сам разработчик. Доказано, что два агента, удовлетворяющие одним и тем же контрактам, функционально эквивалентны в их рамках. Работа открывает путь к доверенным LLM-агентам без переобучения моделей.

Annotation:

Generative models, particularly Large Language Models (LLMs), produce fluent outputs yet lack verifiable guarantees. We adapt Design by Contract (DbC) and type-theoretic principles to introduce a contract layer that mediates every LLM call. Contracts stipulate semantic and type requirements on inputs and outputs, coupled with probabilistic remediation to steer generation toward compliance. The layer exposes the dual view of LLMs as semantic parsers and probabilistic black-box components. Contrac...

ID: 2508.03665v1 cs.LG, cs.AI, I.2.7; I.2.2; I.1.2; D.1.0

arXiv PDF

📄 Beyond risk: A proto-framework for assessing the societal impact of AI systems

2025-08-06

Авторы:

Willem Fourie

Статья критикует доминирующий риск-центричный подход к регулированию ИИ, ограничивающий анализ лишь снижением вреда. Автор предлагает «прото-фреймворк» оценки общественного влияния ИИ через категорию свободы (в духе Канта), противостоящей ответственности. Введены два измерения: свобода как способность (capability) и как возможность (opportunity). Эти измерения привязаны к Целям устойчивого развития ООН, что позволяет системно измерять, как ИИ усиливает или ограничивает свободу индивидов и обществ. Работа даёт первый шаг к операционализации свободы в политике и дополняет существующие риск-ориентированные методы оценки ИИ-систем.

Annotation:

In the discourse on AI regulation, 'responsible AI' is the dominant paradigm, with the focus on mitigating the risks related to AI systems. While this focus is important and necessary, it has limited use for a systematic consideration of AI's societal impact. This paper proposes a proto-framework for assessing the societal impact of AI systems by operationalising the concept of freedom. This proto-framework is intended as a step towards a fully operationalised framework to be used in policymakin...

ID: 2508.03666v1 cs.CY, cs.AI, cs.ET

arXiv PDF

📄 Agent Lightning: Train ANY AI Agents with Reinforcement Learning

2025-08-06

Авторы:

Xufang Luo, Yuge Zhang, Zhiyuan He, Zilong Wang, Siyun Zhao, Dongsheng Li, Luna K. Qiu, Yuqing Yang

Современные методы дообучения LLM-агентов через RL требуют либо глубокой переработки кода агента, либо громоздкого конкатенирования последовательностей с маскированием. Авторы предлагают фреймворк Agent Lightning, который полностью развязывает исполнение агента от процесса обучения. Система представляет выполнение агента как марковский процесс принятия решений и через единый интерфейс преобразует любые траектории (LangChain, OpenAI Agents SDK, AutoGen или «самописные» агенты) в обучающие переходы без изменения кода агента. Введённый RL-алгоритм LightningRL с модулем кредитного присвоения справляется со сложными сценариями: мульти-агентные взаимодействия, динамические workflow. Эксперименты на задачах text-to-SQL, RAG и использовании математических инструментов показали стабильный рост качества, подтверждая пригодность фреймворка для практического дообучения и развёртывания агентов.

Annotation:

We present Agent Lightning, a flexible and extensible framework that enables Reinforcement Learning (RL)-based training of Large Language Models (LLMs) for any AI agent. Unlike existing methods that tightly couple RL training with agent or rely on sequence concatenation with masking, Agent Lightning achieves complete decoupling between agent execution and training, allowing seamless integration with existing agents developed via diverse ways (e.g., using frameworks like LangChain, OpenAI Agents ...

ID: 2508.03680v1 cs.AI, cs.LG

arXiv PDF

📄 Self-Questioning Language Models

2025-08-06

Авторы:

Lili Chen, Mihir Prabhudesai, Katerina Fragkiadaki, Hao Liu, Deepak Pathak

Исследование SQLM решает задачу самосовершенствования больших языковых моделей без внешних данных. Авторы предлагают асимметричный фреймворк самоигры, где «предлагающий» агент генерирует задачи по теме (умножение, алгебра, код), а «решающий» их решает. Обучение обеих сторон ведётся RL: предлагающий получает награду за «золотую середину» сложности, решающий — за согласие m-голосования или прохождение юнит-тестов. На трёх бенчмарках модель без кураторских данных улучшила точность, показывая, что генерация собственных задач и их решение позволяет LLM эффективно развивать рассуждения.

Annotation:

Can large language models improve without external data -- by generating their own questions and answers? We hypothesize that a pre-trained language model can improve its reasoning skills given only a single prompt specifying the topic (e.g., algebra word problems) and asking the model to generate its own questions. To do this, we propose Self-Questioning Language Models (SQLM): an asymmetric self-play framework where a proposer is given the topic and generates a question for a solver, who tries...

ID: 2508.03682v1 cs.LG, cs.AI

arXiv PDF

📄 CompassVerifier: A Unified and Robust Verifier for LLMs Evaluation and Outcome Reward

2025-08-06

Авторы:

Shudong Liu, Hongwei Liu, Junnan Liu, Linchen Xiao, Songyang Gao, Chengqi Lyu, Yuzhe Gu, Wenwei Zhang, Derek F. Wong, Songyang Zhang, Kai Chen

Современные фреймворки оценки LLM полагаются на hand-crafted регулярные выражения или тяжёлые генеративные LLM, что ведёт к хрупкости и высоким расходам. Проблема усугубляется отсутствием систематического бенчмарка для верификаторов. Авторы представляют CompassVerifier — компактную (≤7B) специализированную модель-верификатор, обученную на новом бенчмарке VerifierBench, охватывающем математику, знания и логические задачи. Верификатор устойчив к edge-case ответам (мульти-подзадачи, формулы, бессмысленные вывода) и обобщается на разные домены без настройки. Эксперименты показывают, что CompassVerifier превосходит как rule-based, так и LLM-основанные подходы по точности и вычислительной эффективности, обеспечивая надёжную метрику для оценки и reward-модель для RL.

Annotation:

Answer verification is crucial not only for evaluating large language models (LLMs) by matching their unstructured outputs against standard answers, but also serves as the reward model to guide LLM optimization. Most evaluation frameworks rely on regularized matching or employ general LLMs for answer verification, which demands extensive, repetitive customization for regex rules or evaluation prompts. Two fundamental limitations persist in current methodologies: 1) the absence of comprehensive b...

ID: 2508.03686v1 cs.CL, cs.AI

arXiv PDF

1
2
1441
1442
1443

Показано 14421 - 14425 из 14425 записей