📊 Статистика дайджестов

Всего дайджестов: 34123 Добавлено сегодня: 101

Последнее обновление: сегодня

📄 A DbC Inspired Neurosymbolic Layer for Trustworthy Agent Design

2025-08-06

Авторы:

Claudiu Leoveanu-Condrei

Большие языковые модели генерируют убедительный текст, но не дают формальных гарантий корректности. Авторы переносят идею Design by Contract (DbC) на LLM, внедряя контрактный слой между вызывающим кодом и моделью. Каждый вызов сопровождается контрактом, задающим типовые и семантические ограничения на вход/выход; при нарушении запускается вероятностная дообработка, возвращающая результат в допустимое множество. Контракты декларируются как условия на строго типизированные структуры данных, а валидаторы пишет сам разработчик. Доказано, что два агента, удовлетворяющие одним и тем же контрактам, функционально эквивалентны в их рамках. Работа открывает путь к доверенным LLM-агентам без переобучения моделей.

Annotation:

Generative models, particularly Large Language Models (LLMs), produce fluent outputs yet lack verifiable guarantees. We adapt Design by Contract (DbC) and type-theoretic principles to introduce a contract layer that mediates every LLM call. Contracts stipulate semantic and type requirements on inputs and outputs, coupled with probabilistic remediation to steer generation toward compliance. The layer exposes the dual view of LLMs as semantic parsers and probabilistic black-box components. Contrac...

ID: 2508.03665v1 cs.LG, cs.AI, I.2.7; I.2.2; I.1.2; D.1.0

arXiv PDF

📄 Self-Questioning Language Models

2025-08-06

Авторы:

Lili Chen, Mihir Prabhudesai, Katerina Fragkiadaki, Hao Liu, Deepak Pathak

Исследование SQLM решает задачу самосовершенствования больших языковых моделей без внешних данных. Авторы предлагают асимметричный фреймворк самоигры, где «предлагающий» агент генерирует задачи по теме (умножение, алгебра, код), а «решающий» их решает. Обучение обеих сторон ведётся RL: предлагающий получает награду за «золотую середину» сложности, решающий — за согласие m-голосования или прохождение юнит-тестов. На трёх бенчмарках модель без кураторских данных улучшила точность, показывая, что генерация собственных задач и их решение позволяет LLM эффективно развивать рассуждения.

Annotation:

Can large language models improve without external data -- by generating their own questions and answers? We hypothesize that a pre-trained language model can improve its reasoning skills given only a single prompt specifying the topic (e.g., algebra word problems) and asking the model to generate its own questions. To do this, we propose Self-Questioning Language Models (SQLM): an asymmetric self-play framework where a proposer is given the topic and generates a question for a solver, who tries...

ID: 2508.03682v1 cs.LG, cs.AI

arXiv PDF

Показано 2911 - 2912 из 2912 записей