📚 Саммари научных статей из arXiv

📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 0

Последнее обновление: сегодня

📄 KG-Augmented Executable CoT for Mathematical Coding

2025-08-09

Авторы:

Xingyu Chen, Junxiu An, Jun Guo, Li Wang, Jingcai Guo

```markdown ## КОНТЕКСТ И ПРОБЛЕМАТИКА В последние годы большие языковые модели (Large Language Models, LLMs) достигли значительных успехов в области обработки естественного языка, но в то же время сталкиваются с существенными трудностями при решении сложных задач, требующих высокого уровня логического и математического рассуждения, а также генерации кода. Одной из ключевых проблем является недостаточная точность и надежность моделей при работе с математическими задачами, особенно когда речь идет о генерации кода, который должен не только быть правильным синтаксически, но и проходить проверку на выполнение. Традиционные методы промптинга (prompting) часто не могут обеспечень высокий уровень точности, особенно при работе с задачами, требующими глубокого понимания математических концепций и библиотек. Другой проблемой является неэффективность в использовании внешних источников знаний, таких как математические библиотеки, что может приводить к неточностям в генерации кода или неудачному применению методов. Без какой-либо структурированной поддержки, модели часто не могут эффективно использовать сложные математические знания, что ограничивает их применимость в реальных задачах. ## ПРЕДЛОЖЕННЫЙ МЕТОД Для решения вышеупомянутых проблем, авторы предлагают новый фреймворк под названием KG-Augmented Executable Chain-of-Thought (KGA-ECoT). Этот фреймворк основывается на концепции Chain-of-Thought (CoT), но расширяет его за счет использования знаний, представленных в виде графов знаний (Knowledge Graphs). KGA-ECoT разбивает сложные математические задачи на структурированные графы задач (Structured Task Graph), что позволяет более эффективно извлекать и использовать знания из внешних источников, таких как математические библиотеки. Одним из ключевых компонентов KGA-ECoT является GraphRAG (Graph-based Retrieval-Augmented Generation), который обеспечивает более точное извлечение знаний из математических библиотек. Этот метод позволяет модели не только получать нужную информацию, но и использовать ее для генерации высококачественного кода. Кроме того, KGA-ECoT использует "executable code", то есть код, который может быть выполнен и проверен на точность. Это гарантирует, что генерируемый код будет не только правильным с точки зрения синтаксиса, но и действительно работоспособным. ## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ Для оценки эффективности KGA-ECoT, авторы провели ряд экспериментов на различных математических резонирования бенчмарках. Результаты показали, что KGA-ECoT значительно превосходит существующие методы промптинга, достигая повышения точности от нескольких до десятков процентных пунктов. Эти улучшения были достигнуты благодаря использованию GraphRAG для точного извлечения знаний и выполнения кода, который гарантировал высокую точность вычислений. ## ПРАКТИЧЕСКАЯ ЗНАЧИМОСТЬ KGA-ECoT имеет широкое применение в областях, требующих высокой точности в математическом резонировании и генерации кода. Например, он может быть использован в областях таких как финансовые моделирования, инженерные расчеты, научные исследования, где точность и надежность кода критически важны. Благодаря своей способности эффективно использовать внешние библиотеки и гарантировать высокую точность, KGA-ECoT может стать важной частью разработки программного обеспечения и автоматизации математических задач. ## ВЫВОДЫ И ПЕРСПЕКТИВЫ В заключение, KGA-ECoT представляет собой мощный и гибкий фреймворк для решения сложных математических задач, который сочетает в себе эффективное использование графов знаний и выполняемого кода. Будущие исследования могут фокусироваться на дальнейшем улучшении точности и эффективности этого подхода, а также на его применении в других областях, требующих сложного рассуждения и генерации кода. ```

Annotation:

In recent years, large language models (LLMs) have excelled in natural language processing tasks but face significant challenges in complex reasoning tasks such as mathematical reasoning and code generation. To address these limitations, we propose KG-Augmented Executable Chain-of-Thought (KGA-ECoT), a novel framework that enhances code generation through knowledge graphs and improves mathematical reasoning via executable code. KGA-ECoT decomposes problems into a Structured Task Graph, leverages...

ID: 2508.04072v1 cs.AI

arXiv PDF

📄 GeoSR: Cognitive-Agentic Framework for Probing Geospatial Knowledge Boundaries via Iterative Self-Refinement

2025-08-09

Авторы:

Jinfan Tang, Kunming Wu, Ruifeng Gongxie, Yuya He, Yuankai Wu

## КОНТЕКСТ И ПРОБЛЕМАТИКА В последние годы большие языковые модели (LLMs) стали важной частью исследований в различных областях, включая географические задачи. Несмотря на то, что LLMs демонстрируют удивительную геоспациальную компетентность даже без явного пространственного обучения, они сталкиваются со сложностями в области пространственной консистенции, многошагового резонирования и географического беспристрастия. Традиционные подходы, основанные на простом выводе моделей, часто не могут обеспечить достаточную точность и справедливость прогнозов в географических контекстах. Одним из ключевых проблем является отсутствие встроенных геостатистических принципов в работе LLMs. Например, Tobler's First Law of Geography, которое определяет, что "все места находятся в взаимодействии, но ближайшие места взаимодействуют больше, чем дальние", часто игнорируется в существующих моделях. Это приводит к недостаточному учету пространственных зависимостей и отношений между переменными. Дополнительно, существующие модели часто не учитывают контекстуальные различия между различными географическими регионами, что приводит к неточным и несправедливым прогнозам. Мотивацией для создания GeoSR стало необходимость разработки метода, который может интегрировать географические принципы в процесс вывода LLMs, обеспечивая более точные и консистентные географические прогнозы. Требуется решение, которое сочетает в себе пространственные зависимости, межпеременные отношения и итеративный процесс уточнения, чтобы преодолеть ограничения существующих моделей. ## ПРЕДЛОЖЕННЫЙ МЕТОД GeoSR представляет собой инновационный self-refining agentic reasoning framework, который встраивает географические принципы в итеративный процесс вывода. Он состоит из трех основных агентов, которые взаимодействуют для постепенного улучшения качества прогнозов. 1. **Агент выбора переменных (Variable-Selection Agent)** отвечает за выбор соответствующих ковариат (переменных) из того же местоположения, которые могут быть использованы для улучшения прогнозов. 2. **Агент выбора точек (Point-Selection Agent)** выбирает ссылочные прогнозы из ближайших точек, сгенерированных моделью в предыдущих итерациях. Это позволяет использовать пространственные зависимости для повышения качества прогнозов. 3. **Агент уточнения (Refine Agent)** координирует весь процесс, оценивая качество прогнозов и принимая решение о необходимости дополнительных итераций. Итеративный процесс уточнения в GeoSR позволяет модели улучшать свои прогнозы путем использования пространственных зависимостей и отношений между переменными. Агенты работают вместе, обеспечивая более глубокое понимание контекста и последовательное улучшение прогнозов. ## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ Для проверки эффективности GeoSR были проведены эксперименты на различных географических задачах, включая оценку физических свойств и социально-экономические прогнозы. Результаты показали значительное улучшение качества прогнозов по сравнению со стандартными стратегиями вывода. В частности, GeoSR показал высокую точность в задачах, требующих учета пространственных зависимостей, таких как прогнозирование температуры или доходности в различных регионах. Итеративный процесс уточнения позволил модели улучшить прогнозы, особенно в тех случаях, когда были задействованы данные из ближайших местоположений. ## ПРАКТИЧЕСКАЯ ЗНАЧИМОСТЬ GeoSR имеет широкое применение в областях, требующих точных географических прогнозов. Это может включать в себя задачи по ведению сельского хозяйства, городской развитию, экологии и др. Интеграция географических принципов в LLMs позволяет создавать более точные и справедливые модели, которые могут быть использованы для принятия решений в различных сферах человеческой деятельности. ## ВЫВОДЫ И ПЕРСПЕКТИВЫ GeoSR представляет собой значительный шаг вперед в области географических прогнозов с использованием LLMs. Интеграция геостатистических принципов и итеративного процесса уточнения позволяет достичь более высокой точности и консистентности прогнозов. Будущие исследования могут фокусироваться на дальнейшем улучшении архитектуры GeoSR, включая расширение его возможностей для работы с более сложными географическими данными и задачами.

Annotation:

Recent studies have extended the application of large language models (LLMs) to geographic problems, revealing surprising geospatial competence even without explicit spatial supervision. However, LLMs still face challenges in spatial consistency, multi-hop reasoning, and geographic bias. To address these issues, we propose GeoSR, a self-refining agentic reasoning framework that embeds core geographic principles -- most notably Tobler's First Law of Geography -- into an iterative prediction loop....

ID: 2508.04080v1 cs.AI, stat.OT

arXiv PDF

📄 DET-GS: Depth- and Edge-Aware Regularization for High-Fidelity 3D Gaussian Splatting

2025-08-09

Авторы:

Zexu Huang, Min Xu, Stuart Perry

## КОНТЕКСТ И ПРОБЛЕМАТИКА 3D Gaussian Splatting (3DGS) является передовым методом для эффективного и высококачественного синтеза новых видов в трехмерном пространстве. Однако, несмотря на значительные достижения в этой области, существуют существенные проблемы, связанные с точностью геометрического восстановления при использовании разреженных видов. Традиционные методы регуляризации глубины, основанные на нелокальных подходах, часто не могут точно восстановить тонкие структурные детали, оказываясь чрезвычайно чувствительными к шумам в оценке глубины. Это приводит к потере деталей и неточностям в геометрическом моделировании. Другой ключевой проблемой является игнорирование семантических границ в процессе регуляризации. Методы, использующие обычные сглаживающие методы, часто ухудшают качество реконструкции, так как они не различают важные ребра и текстурные детали, что приводит к ухудшению общего качества визуализации. Эти ограничения не позволяют достичь высокого уровня точности и визуальной достоверности при синтезе новых видов, особенно в условиях разреженного набора входных данных. Мотивацией данной работы является разработка метода, который мог бы преодолеть эти ограничения, обеспечивая точное и высококачественное восстановление геометрии и сохраняя тонкие детали и семантические границы. Такой подход должен быть устойчив к шумам в оценке глубины и способен сохранять важные текстурные особенности, чтобы повысить общую точность и качество реконструкции. ## ПРЕДЛОЖЕННЫЙ МЕТОД В данной работе предлагается новый метод под названием DET-GS (Depth- and Edge-Aware Regularization for 3D Gaussian Splatting), который является унифицированной рамочной структурой для регуляризации глубины и сохранения ребер. Основная идея метода заключается в использовании иерархической геометрической регуляризации глубины, которая адаптивно обеспечивает согласованность на различных уровнях детализации. Это позволяет улучшить точность геометрической реконструкции и увеличить устойчивость к шумам в оценке глубины. Для сохранения семантических границ, метод использует регуляризацию глубины, основанную на детекции ребер (Canny edge detection), которая помогает определить семантически важные границы сцены. Это позволяет сохранить важные детали и ребра, которые могут быть потеряны при использовании традиционных методов сглаживания. Кроме того, в методе используется RGB-guided edge-preserving Total Variation (TV) loss, которая способна сглаживать однородные области, сохраняя при этом высокочастотные детали и текстуры. Это позволяет достичь более высокого качества визуализации, уменьшая шум и неточности в областях, где они могут возникнуть. ## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ Эксперименты проводились на различных данных, включая разреженные виды сцен, для оценки эффективности предложенного метода. Данные включали высококачественные 3D модели и сцены с различными уровнями сложности. Результаты показали, что DET-GS значительно улучшает точность геометрического восстановления и качество визуализации по сравнению со стандартными методами 3DGS. При использовании DET-GS было получено более точное восстановление тонких деталей и структур, а также лучшее сохранение ребер и текстурных особенностей. Метод также показал высокую устойчивость к шумам в данных глубины, что является ключевым преимуществом в сравнении с другими подходами. ## ПРАКТИЧЕСКАЯ ЗНАЧИМОСТЬ Предложенный метод DET-GS имеет широкое применение в области трехмерного моделирования и синтеза новых видов. Он может быть использован в различных приложениях, таких как виртуальная и дополненная реальность, где важна высокая точность и качество визуализации. Преимущества DET-GS включают в себя улучшенную точность геометрического моделирования, сохранение важных деталей и ребер, а также устойчивость к шумам в данных. ## ВЫВОДЫ И ПЕРСПЕКТИВЫ В работе было показано, что DET-GS является эффективным методом для улучшения точности и качества трехмерного моделирования. Он предоставляет новые возможности для создания более достоверных и высококачественных 3D моделей, особенно при работе с разреженными видами. Будущие исследования могут фокусироваться на дальнейшем улучшении метода, включая использование более совершенных методов детекции ребер и расширение его применимости на более широкий класс данных.

Annotation:

3D Gaussian Splatting (3DGS) represents a significant advancement in the field of efficient and high-fidelity novel view synthesis. Despite recent progress, achieving accurate geometric reconstruction under sparse-view conditions remains a fundamental challenge. Existing methods often rely on non-local depth regularization, which fails to capture fine-grained structures and is highly sensitive to depth estimation noise. Furthermore, traditional smoothing methods neglect semantic boundaries and i...

ID: 2508.04099v1 cs.CV, cs.AI

arXiv PDF

📄 SenseCrypt: Sensitivity-guided Selective Homomorphic Encryption for Joint Federated Learning in Cross-Device Scenarios

2025-08-09

Авторы:

Borui Li, Li Yan, Junhao Han, Jianmin Liu, Lei Yu

## КОНТЕКСТ И ПРОБЛЕМАТИКА Федеративное обучение (Federated Learning, FL) становится все более популярным подходом к совместному обучению моделей машинного обучения, сохраняя при этом конфиденциальность данных. Однако обеспечение безопасности в FL представляет серьезные вызовы, особенно в кросс-девайс сценариях, где устройства имеют различные характеристики и распределения данных. Традиционные методы гомоморфного шифрования (Homomorphic Encryption, HE), используемые для защиты конфиденциальности, характеризуются высокими вычислительными издержками и сложностью адаптации. Selective HE методы, которые частично шифруют модельные параметры с помощью глобального маска, были предложены для снижения вычислительных издержек и упрощения адаптации. Однако в кросс-девайс сценариях, где данные клиентов хетерогенны, эти методы могут приводить к ухудшению производительности и увеличению времени обучения из-за "straggling" клиентов. Кроме того, традиционные подходы часто не могут эффективно балансировать безопасность и производительность в условиях неравномерного распределения данных. ## ПРЕДЛОЖЕННЫЙ МЕТОД Для решения этих проблем был предложен метод SenseCrypt, который использует подход на основе чувствительности (Sensitivity-guided selective Homomorphic EnCryption) для адаптивного балансирования безопасности и вычислительных издержек в кросс-девайс сценариях FL. Метод состоит из нескольких этапов. Во-первых, был разработан метод кластеризации клиентов на основе их распределений данных. Этот метод использует метрику чувствительности параметров модели для определения схожести данных клиентов. Затем, для каждого клиента в кластере, был разработан механизм оценки, который определяет количество параметров модели, которые могут быть зашифрованы без причинения "straggling". На последнем этапе, для каждого клиента была сформирована и решена многокритериальная оптимизационная задача, целью которой является минимизация вычислительных издержек HE и максимизация безопасности модели. Это позволяет выбирать оптимальный набор параметров для шифрования, сохраняя при этом высокую точность модели и снижая время обучения. ## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ Эксперименты были проведены на различных наборах данных для оценки эффективности SenseCrypt по сравнению с традиционными методами HE. Результаты показали, что SenseCrypt успешно защищает модель от современных атак инверсии, обеспечивая при этом высокую точность модели, сравнимую с точностью на IID данных. Кроме того, SenseCrypt значительно сокращает время обучения. В зависимости от набора данных и конфигурации, время обучения было сокращено на 58.4%-88.7% по сравнению с традиционными методами HE. Это подтверждает эффективность предложенного подхода в условиях неравномерного распределения данных и различных характеристик клиентов. ## ПРАКТИЧЕСКАЯ ЗНАЧИМОСТЬ SenseCrypt имеет широкое применение в различных областях, где необходимо обеспечить безопасность и конфиденциальность данных во время обучения моделей машинного обучения. Он может быть использован в сферах здравоохранения, финансов, телекоммуникаций и других, где данные часто хранятся на различных устройствах и имеют различные распределения. Преимущества SenseCrypt включают в себя снижение вычислительных издержек, улучшение производительности и сохранение высокой точности модели. Это делает его привлекательным для практического применения в реальных системах FL. ## ВЫВОДЫ И ПЕРСПЕКТИВЫ SenseCrypt представляет собой эффективный и практически значимый подход к обеспечению безопасности в кросс-девайс сценариях FL. Он успешно решает проблему высоких издержек и "straggling" клиентов, характерных для традиционных методов HE. В будущем можно рассмотреть дальнейшее улучшение метода, включая оптимизацию для более сложных сценариев и использование более продвинутых метрик для оценки чувствительности параметров модели. Также могут быть исследованы возможности интеграции SenseCrypt с другими методами обеспечения безопасности в FL.

Annotation:

Homomorphic Encryption (HE) prevails in securing Federated Learning (FL), but suffers from high overhead and adaptation cost. Selective HE methods, which partially encrypt model parameters by a global mask, are expected to protect privacy with reduced overhead and easy adaptation. However, in cross-device scenarios with heterogeneous data and system capabilities, traditional Selective HE methods deteriorate client straggling, and suffer from degraded HE overhead reduction performance. Accordingl...

ID: 2508.04100v1 cs.CR, cs.AI, cs.DC

arXiv PDF

📄 Towards Transparent AI Grading: Semantic Entropy as a Signal for Human-AI Disagreement

2025-08-09

Авторы:

Karrtik Iyer, Manikandan Ravikiran, Prasanna Pendse, Shayan Mohanty

Авторы предлагают решение проблемы несогласия между автоматическими системами оценки и человеческими оценщиками. Они представляют метрику semantic entropy, основанную на разнообразии GPT-4-generated explanations для одного и того же ответа студента. Эта метрика служит proxy для оценки несогласия размышлений между AI и человеком. Авторы рассматривают два вопроса: сходство semantic entropy с несогласием человеческих оценщиков и генерализуемость этой метрики по разным предметным областям. Выводы: semantic entropy может служить interpretable uncertainty signal, улучшая transparency и trustworthiness AI-powered grading. Изучение на ASAP-SAS дало подтверждение того, что этот показатель может значимо варьироваться в зависимости от степени сложности и требований к интерпретации решений.

Annotation:

Automated grading systems can efficiently score short-answer responses, yet they often fail to indicate when a grading decision is uncertain or potentially contentious. We introduce semantic entropy, a measure of variability across multiple GPT-4-generated explanations for the same student response, as a proxy for human grader disagreement. By clustering rationales via entailment-based similarity and computing entropy over these clusters, we quantify the diversity of justifications without relyi...

ID: 2508.04105v1 cs.AI

arXiv PDF

📄 Unlocking the Potential of MLLMs in Referring Expression Segmentation via a Light-weight Mask Decoder

2025-08-09

Авторы:

Jingchao Wang, Zhijian Wu, Dingjiang Huang, Yefeng Zheng, Hong Wang

## КОНТЕКСТ И ПРОБЛЕМАТИКА Referring Expression Segmentation (RES) — это задача, направленная на выделение регионов изображения, описанных специфическими справочными выражениями. В последнее время эта область привлекла значительное внимание благодаря появлению Multimodal Large Models (MLLMs), способных эффективно обрабатывать семантическую информацию. Однако, несмотря на их продвинутые способности к пониманию смысла, MLLMs сталкиваются с трудностями в выполнении пиксельно-густых прогнозов, что является ключевой проблемой в RES. Данная проблема усугубляется тем, что существующие подходы либо используют тяжеловесные модели, такие как Segment Anything Model (SAM) с 632 миллионами параметров, либо прибегают к легковесным, но менее точным решениям. Эта дихотомия между производительностью и затратами на вычисления создает существенный барьер для практического применения RES. Основная мотивация данного исследования заключается в том, чтобы преодолевать эту проблему, максимально используя встроенные визуальные детали, инкодированные в визуальном энкодере MLLM, без необходимости дополнительных моделей. Также, требуется эффективное объединение визуальных и семантических функций для повышения точности предсказания масок. Исследование направлено на разработку нового фреймворка, который сочетает высокую точность с низкими затратами на вычисления, обеспечивая баланс между эффективностью и производительностью. ## ПРЕДЛОЖЕННЫЙ МЕТОД В данной статье представлен MLLMSeg — инновационный фреймворк, предназначенный для решения проблемы точности и стоимости в RES. Основные компоненты MLLMSeg включают в себя: 1. **Использование встроенных визуальных деталей**: Фреймворк полностью использует визуальные детали, закодированные в визуальном энкодере MLLM, не требуя дополнительного визуального энкодера. Это снимает необходимость в тяжеловесных дополнительных компонентах, таких как SAM. 2. **Detail-enhanced and Semantic-consistent Feature Fusion (DSFF)**: Этот модуль является ключевым для интеграции визуальных деталей и семантических функций, выводимых из Large Language Model (LLM) в MLLM. DSFF обеспечивает гармоничное слияние этих двух типов информации, улучшая точность предсказания масок. 3. **Легковесный масковый декодер**: Для достижения высокой точности с минимальными затратами, MLLMSeg использует легковесный масковый декодер с всего 34 миллионами параметров. Этот декодер эффективно обрабатывает детализированные пространственные функции из визуального энкодера и семантические функции из LLM, обеспечивая точные предсказания масок. ## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ Для оценки эффективности MLLMSeg произведены обширные эксперименты, в которых использовались различные наборы данных, специализирующиеся на RES. Результаты показывают, что MLLMSeg превосходит как SAM-based, так и SAM-free решения, достигая высокой точности при значительно меньших вычислительных затратах. Благодаря инновационному подходу к функциональному слиянию и легковесному декодеру, MLLMSeg достигает баланса между производительностью и стоимостью, что делает его привлекательным для практического применения. ## ПРАКТИЧЕСКАЯ ЗНАЧИМОСТЬ MLLMSeg имеет широкий спектр практических приложений в таких областях, как компьютерное зрение, медицинское изображение и автономные системы. Его способность обрабатывать сложные справочные выражения и точно выделять регионы изображения делает его полезным для задач, требующих высокой точности в работе с визуальными данными. Кроме того, легковесная архитектура MLLMSeg позволяет использовать его на устройствах с ограниченными вычислительными ресурсами, что расширяет его применимость в реальных условиях. ## ВЫВОДЫ И ПЕРСПЕКТИВЫ В итоге, MLLMSeg представляет собой балансирующее решение для RES, которое обеспечивает высокую точность при низких затратах на вычисления. Будущие исследования могут расширить этот подход, оптимизируя его для более широкого спектра задач и улучшая его адаптивность к различным доменным данным.

Annotation:

Reference Expression Segmentation (RES) aims to segment image regions specified by referring expressions and has become popular with the rise of multimodal large models (MLLMs). While MLLMs excel in semantic understanding, their token-generation paradigm struggles with pixel-level dense prediction. Existing RES methods either couple MLLMs with the parameter-heavy Segment Anything Model (SAM) with 632M network parameters or adopt SAM-free lightweight pipelines that sacrifice accuracy. To address ...

ID: 2508.04107v2 cs.CV, cs.AI

arXiv PDF

📄 A Compositional Framework for On-the-Fly LTLf Synthesis

2025-08-09

Авторы:

Yongkang Li, Shengping Xiao, Shufang Zhu, Jianwen Li, Geguang Pu

## КОНТЕКСТ И ПРОБЛЕМАТИКА Реактивная синтезирование систем из логики линейного временного порядка на конечных трассах (LTLf) является важной задачей в области автоматического проектирования реактивных систем. Оно заключается в построении контроллера, который гарантирует выполнение заданной спецификации, заданной в виде LTLf-формулы. Традиционно, это сводится к решению двухуровневой игры над Детерминированным Конечным Автоматом (DFA), построенным из LTLf-спецификации. Однако, построение такого DFA представляет сложную вычислительную задачу, которая является 2EXPTIME-complete в худшем случае. Существующие подходы к решению этой проблемы можно разделить на два ключевых направления. Первый подход заключается в композиционном построении DFA до решения игры, что позволяет использовать минимизацию автомата для снижения сложности вычислений. Однако, этот подход может быть неэффективен при работе с большими спецификациями, которые требуют полного построения автомата. Второй подход — инкрементальное построение DFA в процессе решения игры, что позволяет избежать полного построения автомата, но может привести к неоптимальным решениям из-за отсутствия полной информации о структуре системы. В данной работе авторы предлагают новый композиционный подход, который интегрирует преимущества обоих методов. Он ориентирован на решение задач, где спецификация представляет собой большую конъюнкцию меньших LTLf-формул, что является типичным случаем в практических приложениях. Цель состоит в том, чтобы создать более эффективный фреймворк для синтеза, который мог бы обрабатывать большие и сложные спецификации, избегая неэффективности существующих методов. ## ПРЕДЛОЖЕННЫЙ МЕТОД Предлагаемый метод основывается на композиционном подходе к синтезу LTLf, который интегрирует процесс композиции с решением игры, а не с построением DFA. Это достигается за счет разбиения спецификации на меньшие компоненты, которые затем компонуются в процессе решения игры. Авторы предлагают два варианта композиции: первый вариант включает в себя предварительную минимизацию и последующую композицию, в то время как второй вариант основывается на инкрементальной композиции в процессе синтеза. Ключевой инновацией является то, что композиция выполняется «на лету», в процессе решения игры, а не заранее. Это позволяет избежать полного построения DFA, тем самым снижая сложность вычислений. Кроме того, предлагается механизм упрощения (pruning) промежуточных результатов, который позволяет уменьшить сложность последующих композиций и обнаруживать невыполнимость спецификации раньше. ## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ Для оценки эффективности предлагаемого метода авторы провели серию экспериментов на различных наборах данных. Эти данные включали в себя большие и сложные LTLf-спецификации, которые характеризовались высокой степенью композиционности. Эксперименты показали, что предлагаемый метод способен решать значительно больше задач, чем существующие методы. В частности, было показано, что оба варианта композиции — предварительная минимизация и инкрементальная композиция — имеют свои преимущества. Предварительная минимизация позволяет достичь большей эффективности в случаях, когда спецификация может быть значительно упрощена, в то время как инкрементальная композиция лучше подходит для динамического управления процессом синтеза. ## ПРАКТИЧЕСКАЯ ЗНАЧИМОСТЬ Предлагаемый фреймворк имеет широкое применение в области автоматического проектирования реактивных систем, особенно в тех случаях, когда спецификации являются крупными и состоят из множества меньших компонентов. Этот подход может быть использован в различных приложениях, таких как автоматизация производственных процессов, разработка автономных систем и проектирование программного обеспечения с высокими требованиями к надежности. Преимущества этого метода заключаются в его способности обрабатывать большие и сложные спецификации, а также в его гибкости, которая позволяет выбирать между различными стратегиями композиции в зависимости от конкретной задачи. ## ВЫВОДЫ И ПЕРСПЕКТИВЫ В работе был представлен новый композиционный фреймворк для синтеза LTLf, который интегрирует композицию и решение игры в единый процесс. Этот подход демонстрирует высокую эффективность и способность решать задачи, недоступные для существующих методов. Будущие исследования могут быть направлены на дальнейшее улучшение эффективности метода, в том числе путем разработки более продвинутых методов минимизации и оптимизации процесса композиции. Кроме того, можно изучить возможности применения этого фреймворка к другим типам спецификаций и задач синтеза.

Annotation:

Reactive synthesis from Linear Temporal Logic over finite traces (LTLf) can be reduced to a two-player game over a Deterministic Finite Automaton (DFA) of the LTLf specification. The primary challenge here is DFA construction, which is 2EXPTIME-complete in the worst case. Existing techniques either construct the DFA compositionally before solving the game, leveraging automata minimization to mitigate state-space explosion, or build the DFA incrementally during game solving to avoid full DFA cons...

ID: 2508.04116v1 cs.AI

arXiv PDF

📄 AgREE: Agentic Reasoning for Knowledge Graph Completion on Emerging Entities

2025-08-09

Авторы:

Ruochen Zhao, Simone Conia, Eric Peng, Min Li, Saloni Potdar

## КОНТЕКСТ И ПРОБЛЕМАТИКА Комплектация графов знаний (Knowledge Graph Completion, KGC) является ключевой задачей в области знаний, особенно в открытых областях, где данные постоянно изменяются. Существующие подходы к KGC часто основываются на предобученных языковых моделях, предварительно созданных запросах или однократном поиске информации. Однако эти методы сталкиваются с существенными ограничениями, особенно когда речь заходит о неизвестных или растущих сущностях, которые часто не представлены в предобученных моделях. Такие сущности могут включать новые личности, компании, события, которые появляются в новостных потоках или других динамических источниках. Традиционные подходы к KGC требуют значительных ресурсов для обучения и часто не могут эффективно адаптироваться к динамическим средам. Они могут некорректно обрабатывать непопулярные или новые сущности, что приводит к неполным или неточным графам знаний. Эта проблема становится особенно критичной в условиях быстро меняющихся информационных сред, где необходимо обеспечить актуальность и полноту графов знаний. Одной из ключевых проблем является невозможность многих существующих методов эффективно использовать динамические и непредсказуемые источники данных, такие как новостные статьи, блоги или социальные сети. Эти источники часто содержат важную информацию о новых сущностях, которая может быть недоступна в предобученных моделях. Таким образом, необходимо разработать новые подходы, которые могут динамически интегрировать информацию из различных источников и обеспечить более полное представление знаний о новых сущностях. ## ПРЕДЛОЖЕННЫЙ МЕТОД В статье предлагается новый фреймворк под названием AgREE (Agentic Reasoning for Emerging Entities), который использует агентское мышление для комплектации графов знаний. Основная идея AgREE заключается в использовании итеративного поиска и многошагового рассуждения для динамического построения троек знаний (knowledge graph triplets). Агентский подход позволяет системе динамически адаптироваться к новым и неизвестным сущностям, используя стратегический поиск информации и рациональное мышление. AgREE работает в несколько этапов. Сначала, агент выполняет поисковые запросы для получения информации о новой сущности. Затем, он проводит многошаговое рассуждение на основе полученных данных, чтобы сформировать новые тройки знаний. Этот процесс позволяет AgREE динамически обновлять граф знаний, не требуя предварительного обучения на конкретных данных. Ключевой особенностью AgREE является его способность обрабатывать непопулярные или недавно появившиеся сущности, которые могут быть не представлены в предобученных моделях. Используя итеративный поиск и многошаговое рассуждение, AgREE может собирать информацию из различных источников и формировать более полные и актуальные графы знаний. ## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ Авторы провели ряд экспериментов, чтобы оценить эффективность AgREE по сравнению с существующими методами KGC. Эксперименты были проведены на новом бенчмарке, созданном для оценки качества комплектации графов знаний на неизвестных сущностях. Для экспериментов использовались данные из различных источников, включая новостные статьи и веб-страницы. Результаты показали, что AgREE значительно превосходит существующие методы в контексте работы с неизвестными и непопулярными сущностями. В частности, AgREE показал лучшие результаты в построении троек знаний для сущностей, которые не были видны во время предварительного обучения языковых моделей. Повышение качества достигало 13,7% по сравнению с лучшими существующими подходами. ## ПРАКТИЧЕСКАЯ ЗНАЧИМОСТЬ Предложенный метод AgREE имеет широкое применение в областях, требующих поддержания актуальности и полноты графов знаний. Например, в сфере новостей, социальных сетей или электронной коммерции, где необходимо быстро реагировать на появление новых сущностей и информации. AgREE может быть использован для создания более динамических и адаптивных систем знаний, которые могут эффективно интегрировать новую информацию из различных источников. ## ВЫВОДЫ И ПЕРСПЕКТИВЫ AgREE представляет собой новый подход к комплектации графов знаний, который сочетает агентское мышление и стратегический поиск информации. Этот подход демонстрирует высокую эффективность в работе с неизвестными и непопулярными сущностями, что является важной проблемой в современных системах знаний. Будущие исследования могут сосредоточиться на дальнейшей оптимизации метода и его интеграции с другими системами обработки знаний.

Annotation:

Open-domain Knowledge Graph Completion (KGC) faces significant challenges in an ever-changing world, especially when considering the continual emergence of new entities in daily news. Existing approaches for KGC mainly rely on pretrained language models' parametric knowledge, pre-constructed queries, or single-step retrieval, typically requiring substantial supervision and training data. Even so, they often fail to capture comprehensive and up-to-date information about unpopular and/or emerging ...

ID: 2508.04118v1 cs.AI, cs.CL

arXiv PDF

📄 Experimental Analysis of Productive Interaction Strategy with ChatGPT: User Study on Function and Project-level Code Generation Tasks

2025-08-09

Авторы:

Sangwon Hyun, Hyunjun Kim, Jinhyuk Jang, Hyojin Choi, M. Ali Babar

**Резюме** Статья рассматривает проблему недостаточного исследования эффективных методов взаимодействия с Large Language Models (LLMs) в контексте реальных задач программирования, ограниченных простыми проблемами и выборочными приемами. Авторы предлагают комплексный эксперимент, охватывающий более сложные сценарии, в том числе задачи на уровне проекта, а не только функций. В ходе исследования, в котором приняли участие 36 участников разных уровней подготовки, были оценены 15 основных черт взаимодействия (HLI), влияющих на производительность в генерации кода. Отмечены пять ключевых рекомендаций для улучшения этих процессов и разработана категоризация 29 типов ошибок с предложенными мерами их устранения. Основной вывод: три HLI-функции значительно повлияли на производительность, что демонстрирует значимость широкого изучения воздействия человеко-LLM-интеракций на результативность.

Annotation:

The application of Large Language Models (LLMs) is growing in the productive completion of Software Engineering tasks. Yet, studies investigating the productive prompting techniques often employed a limited problem space, primarily focusing on well-known prompting patterns and mainly targeting function-level SE practices. We identify significant gaps in real-world workflows that involve complexities beyond class-level (e.g., multi-class dependencies) and different features that can impact Human-...

ID: 2508.04125v1 cs.SE, cs.AI

arXiv PDF

📄 DS$^2$Net: Detail-Semantic Deep Supervision Network for Medical Image Segmentation

2025-08-09

Авторы:

Zhaohong Huang, Yuxin Zhang, Mingbao Lin, Taojian Zhou, Guorong Cai, Rongrong Ji

--- title: КОНТЕКСТ И ПРОБЛЕМАТИКА --- ### message # КОНТЕКСТ И ПРОБЛЕМАТИКА Медицинская имиджевая сегментация является ключевой задачей в медицинском образовании и клинической практике, так как она позволяет выделять и классифицировать различные структуры в медицинских изображениях, таких как УЗИ, колоноскопия и микроскопия. Однако, несмотря на значительные успехи в области глубокого обучения, существующие методы сегментации часто сталкиваются с проблемами, связанными с качеством и точностью результатов. Одной из основных причин этих проблем является недостаточная эксплуатация взаимодействия между низкоуровневыми детальными функциями и высокоуровневыми семантическими функциями во время процесса обучения. Традиционные методы глубокого надзора (Deep Supervision Networks) обычно фокусируются либо на детальных низкоуровневых функциях, либо на высокоуровневых семантических функциях, но редко учитывают их взаимодействие. Это может привести к потере важной информации и ухудшению качества сегментации. Кроме того, многие существующие подходы используют жестко заданные параметры для управления силой надзора, что может приводить к под оптимальным результатам. ## ПРЕДЛОЖЕННЫЙ МЕТОД Для решения указанных проблем, авторы предлагают новую архитектуру под названием DS$^2$Net (Detail-Semantic Deep Supervision Network). Эта архитектура включает два ключевых модуля: Detail Enhance Module (DEM) и Semantic Enhance Module (SEM). DEM работает на низкоуровневых детальных функциях, выделяя мелкие детали изображений, которые могут быть критически важными для точной сегментации. SEM, с другой стороны, фокусируется на высокоуровневых семантических функциях, которые помогают в идентификации более общих структур и форм. Оба модуля работают вместе, чтобы обеспечить комплементарное надзорное обучение, где детальные и семантические функции совместно улучшают качество сегментации. Кроме того, DS$^2$Net вводит новый подход к управлению силой надзора с помощью неопределенности (uncertainty-based supervision loss). Это позволяет адаптивно регулировать силу надзора для различных уровней функций в зависимости от их неопределенности, что помогает избежать под оптимальных решений, которые часто возникают в традиционных методах. ## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ Авторы провели эксперименты на шести различных бенчмарках, включая данные из колоноскопии, УЗИ и микроскопии. Результаты показывают, что DS$^2$Net постоянно превосходит современные методы сегментации в медицинской области. Например, на колоноскопических данных, DS$^2$Net показал значительное улучшение точности сегментации, особенно в выделении мелких деталей. Кроме того, авторы продемонстрировали, что использование неопределенности в качестве меры для регулирования силы надзора позволяет DS$^2$Net достигать лучших результатов по сравнению с традиционными методами, которые используют фиксированные параметры. ## ПРАКТИЧЕСКАЯ ЗНАЧИМОСТЬ DS$^2$Net имеет широкое применение в медицинской практике. Точная сегментация медицинских изображений критически важна для диагностики и планирования лечения. Например, в колоноскопии, где точность выделения полипов и других аномалий может быть фактором жизни или смерти, DS$^2$Net может значительно улучшить качество диагностики. Благодаря своей способности обрабатывать как детальные, так и семантические функции, DS$^2$Net может быть применен в различных медицинских областях, где высококачественная сегментация имеет решающее значение. ## ВЫВОДЫ И ПЕРСПЕКТИВЫ DS$^2$Net представляет собой новую парадигму в медицинской имиджевой сегментации, которая объединяет детальные и семантические функции в единый фреймворк. Это позволяет достичь лучших результатов по сравнению с традиционными методами. В будущем, исследования могут быть направлены на дальнейшее улучшение архитектуры, включая интеграцию дополнительных модулей для обработки более сложных медицинских данных.

Annotation:

Deep Supervision Networks exhibit significant efficacy for the medical imaging community. Nevertheless, existing work merely supervises either the coarse-grained semantic features or fine-grained detailed features in isolation, which compromises the fact that these two types of features hold vital relationships in medical image analysis. We advocate the powers of complementary feature supervision for medical image segmentation, by proposing a Detail-Semantic Deep Supervision Network (DS$^2$Net)....

ID: 2508.04131v1 cs.CV, cs.AI

arXiv PDF

1
2
3369
3370
3371
3372
3373
3402
3403

Показано 33701 - 33710 из 34022 записей