📊 Статистика дайджестов
Всего дайджестов: 34022 Добавлено сегодня: 0
Последнее обновление: сегодня
📄 Cloud Investigation Automation Framework (CIAF): An AI-Driven Approach to Cloud Forensics
2025-10-04Авторы:
Dalal Alharthi, Ivan Roberto Kawaminami Garcia
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Large Language Models (LLMs) have gained prominence in domains including
cloud security and forensics. Yet cloud forensic investigations still rely on
manual analysis, making them time-consuming and error-prone. LLMs can mimic
human reasoning, offering a pathway to automating cloud log analysis. To
address this, we introduce the Cloud Investigation Automation Framework (CIAF),
an ontology-driven framework that systematically investigates cloud forensic
logs while improving efficiency and accurac...
Авторы:
Dalal Alharthi, Ivan Roberto Kawaminami Garcia
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Large language models have gained widespread prominence, yet their
vulnerability to prompt injection and other adversarial attacks remains a
critical concern. This paper argues for a security-by-design AI paradigm that
proactively mitigates LLM vulnerabilities while enhancing performance. To
achieve this, we introduce PromptShield, an ontology-driven framework that
ensures deterministic and secure prompt interactions. It standardizes user
inputs through semantic validation, eliminating ambiguity...
Авторы:
Chuan He, Shuyi Ren, Jingwei Mao, Erik G. Larsson
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
In this paper, we propose DeMuon, a method for decentralized matrix
optimization over a given communication topology. DeMuon incorporates matrix
orthogonalization via Newton-Schulz iterations-a technique inherited from its
centralized predecessor, Muon-and employs gradient tracking to mitigate
heterogeneity among local functions. Under heavy-tailed noise conditions and
additional mild assumptions, we establish the iteration complexity of DeMuon
for reaching an approximate stochastic stationary p...
Авторы:
Florensia Widjaja, Zhangtianyi Chen, Juexiao Zhou
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Bioinformatics tools are essential for complex computational biology tasks,
yet their integration with emerging AI-agent frameworks is hindered by
incompatible interfaces, heterogeneous input-output formats, and inconsistent
parameter conventions. The Model Context Protocol (MCP) provides a standardized
framework for tool-AI communication, but manually converting hundreds of
existing and rapidly growing specialized bioinformatics tools into
MCP-compliant servers is labor-intensive and unsustaina...
Авторы:
Zeyuan Zhao, Chaoran Li, Shao Zhang, Ying Wen
## Контекст
Multi-Agent Pickup and Delivery (MAPD) является усложненной формой Multi-Agent Path Finding (MAPF), требующей от агентов выполнять задачи с фиксированными точками подбора и доставки в последовательном порядке. Хотя learning-based методы демонстрируют улучшения в MAPD, они часто сталкиваются с проблемами в сложных средах, таких как хранилища, с узкими проходами и длинными коридорами. Эти окружения требуют сильной связности и глобального видения, но ограниченность локальных сенсоров и точечная связь в локальной модели не позволяют эффективно решить эти проблемы.
В настоящей работе мы исследуем возможности применения моделей последовательностей для MAPD и доказываем, что подходы, основанные на sequence modeling, обладают order-invariant optimality, делая их применимыми для MAPD. Этот подход позволяет существенно уменьшить вычислительную сложность и заменить точечную связь на модель связи с широким покрытием.
## Метод
Мы предлагаем Sequential Pathfinder (SePar), основанный на Transformer-парадигме, чтобы решить задачу MAPD. Модель SePar использует self-attention механизмы для implicit information exchange, обеспечивая глобальное видение и эффективное дистрибутивное распределение решений. Эта модель преобразует сложность вычислений из экспоненциальной в линейную, ускоряя решение в сложных средах.
SePar также включает imitation learning в сложных задачах, таких как warehouse-like среды, что позволяет повысить точность и скорость решения, даже при недостаточном обучении на реальных данных.
## Результаты
В экспериментах мы сравнили SePar с другими state-of-the-art методами в MAPD на разных наборах данных. Результаты показали, что SePar постоянно демонстрирует лучшие результаты в MAPD и их вариациях, превосходя другие learning-based методы в скорости и точности. Более того, SePar показал гибкость в общении с новыми, неизвестными средами и выполнении задач, которые приводят к коллизиям в стандартных подходах.
## Значимость
Предлагаемый подход может быть применен в различных сложных средах, таких как роботов-дроны, автономные автомобили и warehouse management. Он предлагает существенные преимущества, включая снижение затрат на вычисления, увеличение скорости решения и гибкость в различных окружениях. Это может привести к улучшению производительности в задачах многоагентного управления в робототехнике и логистике.
## Выводы
Мы доказали, что sequence modeling является эффективным подходом для MAPD и что SePar может быть значительным шагом в решении MAPD в warehouse-like средах. Наша модель показала лучшие результаты в сравнении с другими методами и обеспечила гибкость в работе с новыми средами. Будущие исследования будут направлены на дальнейшее улучшение модели и ее применение в задачах робототехнического управления.
Annotation:
Multi-Agent Pickup and Delivery (MAPD) is a challenging extension of
Multi-Agent Path Finding (MAPF), where agents are required to sequentially
complete tasks with fixed-location pickup and delivery demands. Although
learning-based methods have made progress in MAPD, they often perform poorly in
warehouse-like environments with narrow pathways and long corridors when
relying only on local observations for distributed decision-making.
Communication learning can alleviate the lack of global inform...
Авторы:
Lingxiao Kong, Cong Yang, Oya Deniz Beyan, Zeyd Boukhers
## Контекст
Оптимизация больших языковых моделей (LLMs) представляет собой сложную задачу, включающую в себя несколько целей, таких как точность, эффективность, экономичность и личная настройка. Существующие подходы часто ориентированы на одну задачу, но не подходят для удовлетворения множества целей одновременно. Многообъектная рейнфорсментное обучение (MORL) предлагает возможность оптимизировать несколько целей одновременно, но столкновение с техническими трудностями, такими как неопределенные взаимосвязи между целями, требует развития более эффективных и гибких решений. Мотивация заключается в устранении этих проблем и расширении возможностей MORL для LLMs.
## Метод
MORL включает в себя несколько методологий, включая параллельное мульти-обучение и би-уровневые параметры, позволяющие модели учитывать несколько целей в процессе обучения. Архитектура MORL включает в себя сложную сеть, где каждая цель оценивается в зависимости от других целей, что дает более комплексное представление о взаимосвязях. Технические решения включают в себя адаптивные стратегии, которые позволяют модели учитывать отношения между целями и адаптироваться к изменяющимся обстоятельствам. Эти принципы применяются для обучения моделей, которые могут эффективно учитывать несколько целей во время работы.
## Результаты
На основе MORL были проведены эксперименты, включающие использование различных целей, таких как точность, эффективность и личная настройка, для LLMs. Использовались различные данные, включая текстовые данные, для оценки различных стратегий MORL. Результаты показали, что стратегии MORL могут эффективно управлять отношениями между целями, предоставляя более точные и эффективные результаты. Также были выявлены отдельные значительные улучшения в производительности при использовании MORL по сравнению с одно-целевыми подходами.
## Значимость
Полученные результаты могут быть применены в сферах, таких как личная настройка языковых моделей, эффективное использование ресурсов и улучшение качества ответов. Избавление от несогласованности в целях и повышение обобщающих возможностей моделей может привести к более широкому применению LLMs в различных областях. Это также открывает новые возможности для развития более универсальных моделей, которые могут быть ориентированы на различные пользователей и задачи.
## Выводы
Результаты MORL показали, что этот подход эффективен для оптимизации нескольких целей в LLMs. Будущие исследования будут сфокусированы на развитии meta-policy MORL, чтобы улучшить ее эффективность и гиб
Annotation:
Multi-Objective Reinforcement Learning (MORL) presents significant challenges
and opportunities for optimizing multiple objectives in Large Language Models
(LLMs). We introduce a MORL taxonomy and examine the advantages and limitations
of various MORL methods when applied to LLM optimization, identifying the need
for efficient and flexible approaches that accommodate personalization
functionality and inherent complexities in LLMs and RL. We propose a vision for
a MORL benchmarking framework that...
Авторы:
Alejandro D. Mousist
## Контекст
Обеспечение автономных операций на борту космических аппаратов представляет одну из самых актуальных проблем в современном космонавтике. Одним из ключевых аспектов этой задачи является эффективное управление тепловыми ресурсами, которое требует достоверного и адаптивного контроля при минимальном потреблении ресурсов. Несмотря на то, что существуют технологии для управления тепловыми ресурсами, они часто требуют значительных вычислительных ресурсов и не вполне удовлетворяют требованиям минимализации отказов в условиях активного оперативного режима. В этом контексте проект ASTREA (Autonomous Spacecraft Thermal REgulation Agent) представляет собой крутой шаг вперед, поскольку предлагает решение, которое объединяет семантическую рациональность и адаптивный контроль в одной системе.
## Метод
ASTREA широко использует технологии глубокого обучения, в частности, развитие Large Language Model (LLM) и распределенных систем рекомендаций. Основной инновацией является интеграция LLM-агента с реинфорсмент-контроллером в рамках асинхронной архитектуры. Эта конфигурация позволяет гибко адаптироваться к условиям реальных космических операций. Особенностью методологии является использование тренажерного центра с большим набором тестовых данных, позволяющих тренировать и проверять систему в условиях, наблюдаемых в космосе. Таким образом, ASTREA предлагает новый подход к космическим операциям, который включает в себя агентскую логику и рациональный подход к решению проблемы теплового регулирования.
## Результаты
Проведенные эксперименты показали, что на главной платформе ASTREA, работающей на земле, LLM-агент значительно улучшает тепловую стабильность и снижает частоту нарушений. Он показал способность системы адаптироваться к нестандартным ситуациям, что демонстрирует мощность глубокого обучения в решении проблем управления космическими тепловыми ресурсами. Однако, при переходе на борт Международной Космической Станции (МКС), было выявлено некоторое снижение эффективности, связанное с задержками в обработке информации. Эти задержки становятся критичными в условиях быстрых тепловых циклов, которые характерны для спутников в низкую орбиту Земли (ЛОС). Таким образом, результаты показывают, что, несмотря на прогресс, есть технические вызовы, которые требуют улучшения.
## Значимость
ASTREA может быть применена в широком кругу задач, связанных с космическими операциями, включая не только тепловое регулирование, но и другие аспекты автономного управления. Одним из основных преимущест
Annotation:
This paper presents ASTREA, the first agentic system deployed on
flight-heritage hardware (TRL 9) for autonomous spacecraft operations. Using
thermal control as a representative use case, we integrate a
resource-constrained Large Language Model (LLM) agent with a reinforcement
learning controller in an asynchronous architecture tailored for
space-qualified platforms. Ground experiments show that LLM-guided supervision
improves thermal stability and reduces violations, confirming the feasibility
...
Авторы:
Leo Ho, Yinghao Huang, Dafei Qin, Mingyi Shi, Wangpok Tse, Wei Liu, Junichi Yamagishi, Taku Komura
## Контекст
В целях повышения качества распознавания и изучения динамичных интерактивных поведений между двумя людьми, авторы проводят исследования в области моделирования и предсказания человеческих механизмов коммуникации. Основной проблемой является учет сложных интерактивных ситуаций, которые включают в себя движения, выражения лица и звуковые сигналы, развивающиеся в течение длительного времени. Традиционные модели часто ограничиваются моделированием одного человека или разговорных жестов двух людей, не учитывая изменения ориентации и позиции тела в процессе взаимодействия. Мотивация для данного исследования заключается в разработке более точных методов моделирования дважды параллельно — индивидуальных движений каждого участника и их взаимодействия.
## Метод
Для решения вышеуказанных вопросов был разработан метод, основанный на моделировании динамических и семантически точных взаимодействий. Для этого был создан новый датасет InterAct, включающий в себя 241 последовательностей движений двух участников, которые выполняют задачи или взаимодействуют в реальных сценариях. Основная особенность датасета — полная модель взаимодействия: аудио, телесные движения и выражения лица каждого участника записываются в течение одной минуты или дольше. Для моделирования разработана методика, основанная на методах распространения (diffusion-based methods), при которой движения тела регрессируются по шагам и улучшаются с помощью механизма гибкой файн-тюнинга для более точных выражений лица.
## Результаты
Результаты исследования показали высокую точность в предсказании движений и выражений лица в интерактивных сценариях. Данные из датасета InterAct демонстрируют перспективу в развитии методов моделирования интерактивных поведений, недоступных ранее. Регрессия движений в два этапа позволила повысить точность и консистентность моделей. Также была продемонстрирована возможность адаптации модели к уточнению выражений лица, что улучшило точность воспроизведения лица в течение длительного времени.
## Значимость
Полученные результаты имеют широкие практические приложения в разработке систем видеоанализа, синтеза глубокого значения и виртуальных актеров. Модель InterAct может быть применена в области видеоигр, развития систем виртуальных реальности и видеоредактирования. Особенностью данного подхода является то, что он позволяет моделировать не только телесные движения, но и выражения лица и звуковые сигналы, что делает результаты более реалистичными и информативными.
## Выводы
Исследование показало, что InterAct — это первый датасет, который полностью модели
Annotation:
We address the problem of accurate capture of interactive behaviors between
two people in daily scenarios. Most previous works either only consider one
person or solely focus on conversational gestures of two people, assuming the
body orientation and/or position of each actor are constant or barely change
over each interaction. In contrast, we propose to simultaneously model two
people's activities, and target objective-driven, dynamic, and semantically
consistent interactions which often span l...
Авторы:
Yunzhe Wang, Volkan Ustun, Chris McGroarty
## Контекст
Сложные ситуации с многоагентными взаимодействиями широко распространены в различных областях, включая игры, робототехнику и управление. Одной из основных проблем в этой области является необходимость осуществлять эффективную стратегическую планирование в трехмерных пространствах, чтобы при этом сохранить высокую точность моделирования. Традиционные подходы часто либо требуют высокой вычислительной стоимости, либо теряют точность поведения агентов. Улучшение текущих методов моделирования требует создания более эффективных симуляторов, которые бы сочетали высокую точность и масштабируемость. Это требуется для создания реалистичных ситуаций с многоагентными взаимодействиями, которые могут использоваться в исследованиях, обучении и тестировании алгоритмов управления.
## Метод
Предложенный подход, DECOY, представляет собой дискретизированную симуляцию трехмерных ландшафтов с многоагентными взаимодействиями. Он абстрагирует сложные поведения агентов в 3D-пространстве, сосредоточившись на высокоуровневых решениях, таких как морфологические действия и позиционирование. Используя игру Counter-Strike: Global Offensive (CS:GO) в качестве тестовой площадки, DECOY моделирует стратегическое поведение с помощью системы узлов, где каждый узел представляет собой точку в ландшафте, к которой агент может перейти. Для предсказания поведения используются нейронные модели, обученные на реальных данных из турниров CS:GO. Эти модели преобразуют дискретные действия в реакции героя на меняющуюся ситуацию. Этот подход позволяет сохранять высокую точность моделирования среды, при этом значительно сокращая вычислительные затраты.
## Результаты
Исследования показали, что DECOY эффективно моделирует действия агентов в 3D-пространстве, используя только дискретные решения. Эксперименты были проведены на реальных данных из турниров CS:GO. На основе этих данных были получены реплеи, которые точно воспроизводили поведение реальных игроков. Эксперименты также показали, что DECOY может эффективно использоваться для моделирования стратегического взаимодействия многоагентных систем в различных сценариях. Это демонстрирует высокую точность и скорость модели DECOY в сложных ситуациях с многоагентными взаимодействиями.
## Значимость
DECOY может быть применен в различных областях, включая игровые исследования, робототехнику, искусственный интеллект и управление. Он предоставляет значительные преимущества по сравнению с традиционными методами, включая высокую эффективность, точность и масштабируемость. Этот подход может способствовать ра
Annotation:
Modern simulation environments for complex multi-agent interactions must
balance high-fidelity detail with computational efficiency. We present DECOY, a
novel multi-agent simulator that abstracts strategic, long-horizon planning in
3D terrains into high-level discretized simulation while preserving low-level
environmental fidelity. Using Counter-Strike: Global Offensive (CS:GO) as a
testbed, our framework accurately simulates gameplay using only movement
decisions as tactical positioning -- with...
📄 Dynamic Speculative Agent Planning
2025-09-05Авторы:
Yilin Guan, Wenyue Hua, Qingfeng Lan, Sun Fei, Dujian Ding, Devang Acharya, Chi Wang, William Yang Wang
#### Контекст
Модели языка с трансформерами (LLM) достигли впечатляющих результатов в обработке текста, что привело к их широкому распространению в различных сферах. Однако работа этих моделей требует высоких ресурсов, включая высокую задержку и высокие затраты на выполнение запросов. Эти ограничения становятся критическими для применения в реальном времени, где требуется быстрая реакция и экономичность. Несмотря на развитие методов ускорения, такие как декомпозиция модели (модель управления), они имеют серьезные недостатки, такие как потеря точности, требование дорогостоящих операций во время обучения или ограниченную гибкость в управлении затратами. Наша модель Dynamic Speculative Planning (DSP) предлагается как решение этих проблем, предлагая гибкое решение для ускорения, сохраняя качество и уменьшая затраты.
#### Метод
DSP является асинхронным фреймворком онлайн-обучения на основе подкрепления, который включает в себя спекулятивную планировку. Он работает за счет асинхронного выполнения нескольких вариантов планирования, что позволяет оптимизировать объективный функционал, сбалансировав задержку и экономические затраты. Для этого используется модель управления, которая принимает решения о том, какие варианты должны быть выполнены или прерваны, чтобы минимизировать общий конечно-классовый риск. Этот подход позволяет снизить общие затраты на выполнение запросов, при этом сохраняя высокую точность и поддерживая оптимальный баланс между скоростью и экономичностью.
#### Результаты
Мы провести эксперименты на двух стандартных наборах данных для оценки DSP. Он показал себя эффективно, достигая скорости работы, сопоставимой с самыми быстрыми методами ускорения, при этом существенно снижая общую стоимость работы. В сравнении с другими подходами, DSP уменьшил затраты на 30%, а также уменьшил необходимые затраты на 60%. Эти результаты подтверждают, что DSP не только эффективен, но и гибкий, позволяя пользователю регулировать торговую стоимость системы.
#### Значимость
DSP может быть использован в различных сферах, где требуется быстрая и экономичная обработка текста, таких как системы рекомендации, поисковые системы и диалоговые системы. Он предоставляет преимущество в скорости и экономичности, без потери качества. Это делает его привлекательным для приложений, где быстрота ответа и экономичность являются ключевыми факторами.
#### Выводы
Мы представили Dynamic Speculative Planning, мощный подход для ускорения обработки запросов в моделях языка, который позволяет достичь высокой эффективности и гибкости. В будущем, наша работа будет направлена на расширение возможностей DSP, в
Annotation:
Despite their remarkable success in complex tasks propelling widespread
adoption, large language-model-based agents still face critical deployment
challenges due to prohibitive latency and inference costs. While recent work
has explored various methods to accelerate inference, existing approaches
suffer from significant limitations: they either fail to preserve performance
fidelity, require extensive offline training of router modules, or incur
excessive operational costs. Moreover, they provide...
Показано 21 -
30
из 34 записей