📊 Статистика дайджестов
Всего дайджестов: 34022 Добавлено сегодня: 82
Последнее обновление: сегодня
Авторы:
Xiang Xiang, Qinhao Zhou, Zhuo Xu, Jing Ma, Jiaxin Dai, Yifan Liang, Hanlin Li
## Контекст
Открытый мир (open-world) — это многопрофильная область исследований, которая направлена на обнаружение и обработку неизвестных классов в данных. Открытый мир отличается от стандартных сценариев, где модели обучаются только на известных классах. В открытом мире необходимо обнаруживать неизвестные классы и обновлять модель в режиме реального времени. Существующие методы, такие как OOD-обнаружение и инкрементное обучение, сталкиваются с проблемами: OOD-обнаружение не обновляет знания модели, а инкрементное обучение требует наличия меток для новых классов, что не соответствует открытому миру. Наличие этих проблем подчеркивает необходимость разработки универсального подхода, который мог бы объединить OOD-обнаружение, обнаружение новых классов и инкрементное обучение в единое целое.
## Метод
OpenHAIV представляет собой инновационный фреймворк, который решает вышеуказанные проблемы. Он состоит из трех основных компонентов:
1. **OOD-обнаружение (Out-of-Distribution Detection):** Этот компонент позволяет модели определять новые классы в данных.
2. **Обнаружение новых классов (New Class Discovery):** Этот модуль использует OOD-обнаруженные данные для выделения и обработки новых классов.
3. **Инкрементное обучение (Incremental Continual Fine-tuning):** Этот модуль обновляет модель, используя обнаруженные новые классы, и позволяет ей продолжительно обучаться в открытом мире.
Технология OpenHAIV лежит в основе модели представления, объединяющей эти компоненты в единую целостную систему.
## Результаты
Эксперименты проводились на стандартных датасетах, в том числе CIFAR-100, ImageNet или TinyImageNet. Открытый мир был воспроизведен, добавляя неизвестные классы во время выполнения. Результаты показали, что OpenHAIV превосходит существующие методы в обнаружении неизвестных классов, в новом классе обнаружения и сохранении модели на протяжении длительного времени. Открытый код и результаты доступны на сайте https://haiv-lab.github.io/openhaiv .
## Значимость
OpenHAIV открывает новые возможности в широких областях применения, таких как робототехника, медицина, анализ данных и мониторинг сетей. Он позволяет моделям не только распознавать данные, но и адаптироваться к новым условиям в реальном времени. Это предоставляет потенциал для улучшения производительности в сложных интеллектуальных системах.
## Выводы
OpenHAIV представляет собой новую модель, которая объединяет OOD-обнаружение, обнаружение новых классов и инкрементное обучение. Это решение развивает открытый мир, расширяя возможности моделей в реальном времени. Будущие исследования будут направлены на улучшение эффективности фреймворка, а также на расширение его применения в разли
Annotation:
Substantial progress has been made in various techniques for open-world
recognition. Out-of-distribution (OOD) detection methods can effectively
distinguish between known and unknown classes in the data, while incremental
learning enables continuous model knowledge updates. However, in open-world
scenarios, these approaches still face limitations. Relying solely on OOD
detection does not facilitate knowledge updates in the model, and incremental
fine-tuning typically requires supervised conditio...
Авторы:
Shubhra Ghosh, Abhilekh Borah, Aditya Kumar Guru, Kripabandhu Ghosh
## Контекст
Актуальность исследования связана с быстрым развитием систем на основе Больших Лингвистических Моделей (LLM), которые применяются для обеспечения систем роботов-техпомощников. Одной из основных проблем в этой области является недостаточная оценка устойчивости таких систем к внесению обобщенных изменений в фактические вопросы. Эти изменения, называемые "обфускацией", могут состоять в искажении именованных сущностей, добавлении развлекательных материалов или смыслового перегружения. Без тестирования таких изменений невозможно оценить надежность и точность LLMs в работе с вопросами и ответами. Исследование посвящено выявлению этих проблем и разработке системы для их систематического исследования.
## Метод
Методология исследования основывается на разработке многоуровневой системы обфускации, которая включает три различных типа изменений в вопросах. **Named-Entity Indirection** состоит в замене именованных сущностей (например, ФИО, местами происшествий) на их формальные представления (например, "Субъект 1"). **Distractor Indirection** включает в себя вывод отвлеченных ответных вариантов, которые не соответствуют фактическим данным. **Contextual Overload** предполагает добавление лишней информации, которая может сбить с толку модель. Таким образом, ObfusQAte представляет собой новую методологию для тестирования LLM на систематические искажения вопросов в ходе имитации реальных условий работы.
## Результаты
В ходе экспериментов, проведенных с использованием широкого круга данных, было изучено поведение LLMs в ответ на обфусцированные вопросы. Основной показатель — это уменьшение точности ответов, возрастающее в небольших шагах при наличии обфускации. Модели не только предоставляют неточные ответы, но и вводят ложноположительные варианты. Эти результаты были получены при оценке моделей на объеме данных, представляющем собой широкую спектр текстов, включая новостные материалы, энциклопедические статьи и справочные данные.
## Значимость
Результаты имеют важное значение для развития роботов-техпомощников, так как позволяют оценить устойчивость LLM к ошибкам при обобщенных вопросах. Обфускация позволяет выявить ошибки в моделях, мотивируя разработку методов улучшения их надежности. Эта работа может быть применена в сферах, где точность ответов критична, например, в медицине, юриспруденции и финансовых системах. Она также открывает пути для развития новых моделей устойчивых к таким изменениям.
## Выводы
Разработанная ObfusQAte-фреймворк предоставляет многоуровневый подход для оценки устойчивости LLM к обфускации вопросов. Основные достижения включаю
Annotation:
The rapid proliferation of Large Language Models (LLMs) has significantly
contributed to the development of equitable AI systems capable of factual
question-answering (QA). However, no known study tests the LLMs' robustness
when presented with obfuscated versions of questions. To systematically
evaluate these limitations, we propose a novel technique, ObfusQAte and,
leveraging the same, introduce ObfusQA, a comprehensive, first of its kind,
framework with multi-tiered obfuscation levels designed...
Авторы:
He Kong, Die Hu, Jingguo Ge, Liangxiong Li, Hui Li, Tong Li
#### Контекст
Проблематика автоматизации подбора и тестирования уязвимостей систем широко известна в сфере кибербезопасности. Несмотря на развитие Large Language Models (LLMs), они всё ещё сталкиваются с рядом ограничений при использовании в penetration testing. Это включает неэффективность в реагировании на ошибки, недостаточную многошаговую рациональность и невозможность выполнения сложных задач в полной исчерпывающей формате. Эти ограничения приводят к необходимости развития более рациональных и адаптивных моделей для повышения эффективности.
#### Метод
Разработанный Pentest-R1 использует двухступенчатую схему работы на основе reinforcement learning. На первом этапе LLM проходит offline reinforcement learning с использованием большого набора данных, состоящего из реальных многошаговых walkthroughs. Это позволяет модели приобрести основные принципы атак. На втором этапе LLM участвует в interactive Capture The Flag (CTF), где она получает обратную связь от среды и изучает стратегии не только для решения задач, но и для самокоррекции ошибок. Это два этапа обеспечивают LLM с подробным пониманием задач и высокой степенью адаптивности.
#### Результаты
Проведенные эксперименты показали, что Pentest-R1 обеспечивает значительный прогресс в автоматизации penetration testing. На AutoPenBench он достиг 24.2% успешных попыток, приблизившись к стандарту Gemini 2.5 Flash и значительно превосходя другие модели. На Cybench Pentest-R1 показал 15.0% успешных задач в условиях неуправляемости, показав новую рабочую метку для open-source LLMs и совпадая с результатами топовых закрытых моделей. Анализы апбликации подтвердили важность сочетания обучения в оффлайн и онлайн стадиях.
#### Значимость
Pentest-R1 может иметь широкое применение в автоматизации безопасности и penetration testing. Он оптимизирует процессы, снижает зависимость от ручного участия экспертов и улучшает качество расчетов. Это может привести к более эффективному управлению уязвимостями и сокращению времени реакции в кибербезопасности.
#### Выводы
Результаты исследования подтверждают высокую эффективность Pentest-R1 в области penetration testing. Будущие исследования будут сосредоточены на улучшении моделей, интеграции с другими системами и расширении области применения.
Annotation:
Automating penetration testing is crucial for enhancing cybersecurity, yet
current Large Language Models (LLMs) face significant limitations in this
domain, including poor error handling, inefficient reasoning, and an inability
to perform complex end-to-end tasks autonomously. To address these challenges,
we introduce Pentest-R1, a novel framework designed to optimize LLM reasoning
capabilities for this task through a two-stage reinforcement learning pipeline.
We first construct a dataset of ove...
Авторы:
Jun Li
## Контекст
Нейронные сети (NN) широко применяются в различных областях, от обработки естественного языка до диагностики медицинских изображений. Однако многие их свойства, такие как обучение, гибкость и общепринятость, еще не полностью поняты. Одной из основных проблем является нехватка методов для оценки структуры и поведения индивидуальных экземпляров нейронных сетей без задействования целых контекстов обучения. Отсутствие таких методов ограничивает возможность провести глубокий анализ и диагностику этих средств. Это влечет за собой риски, такие как незаметные уязвимости и недостаточность в ситуациях с плохим обучением. Необходимо развить методы, позволяющие легко оценивать структуру и поведение нейронных сетей на основе их индивидуальных свойств.
## Метод
Для исследования структуры нейронных сетей был предложен подход, основанный на статистической механике, а именно на явлении реплика-симметрии-разрыва (RSB) в спин-глазах. Этот подход предполагает конструирование модели типа Hopfield-spin-глаза из данной полносвязной нейронной сети (FNN). Отклики симуляций реплик служат основным дескриптором для FNN. Этот подход позволяет получить конечный спин-глаз, который характеризует FNN, используя для этого только информацию о структуре нейронной сети и без необходимости прохождения обучения. Это дает возможность выявить некоторые комплексные структурные свойства, не охваченные традиционными метриками, такими как потери и точность.
## Результаты
Полученные результаты показали, что этот подход может быть использован для выявления скрытых свойств FNN, таких как способность подгонки данных, гибкость и устойчивость к шумам. Экспериментальные исследования проводились на нескольких FNN, включая модели, обученные на различных датасетах. Результаты показали, что данный подход может выделять структуру FNN, которая не видна при использовании традиционных оценок, таких как потери или точность. Таким образом, это дает новые возможности для анализа и диагностики нейронных сетей в ситуациях, когда традиционные метрики не дают полного изображения.
## Значимость
Предложенный подход имеет большое значение в различных областях применения нейронных сетей. Он может быть применен для моделирования структуры и выявления уязвимостей в сетях, в том числе для зрелища и проверки моделей в ситуациях, когда данные недостаточно хорошо разделяются, или когда есть риск выхода за рамки обучения. Это также может помочь в ситуациях, где необходимо проверить модели на наличие незаметных уязвимостей, без необходимости проходить тяжелый процесс обучения. Это
Annotation:
This work presents a statistical mechanics characterization of neural
networks, motivated by the replica symmetry breaking (RSB) phenomenon in spin
glasses. A Hopfield-type spin glass model is constructed from a given
feedforward neural network (FNN). Overlaps between simulated replica samples
serve as a characteristic descriptor of the FNN. The connection between the
spin-glass description and commonly studied properties of the FNN -- such as
data fitting, capacity, generalization, and robustne...
📄 Grasp-HGN: Grasping the Unexpected
2025-08-13Авторы:
Mehrshad Zandigohar, Mallesham Dasari, Gunar Schirner
#### Контекст
Роботизированные протезные руки представляют большой потенциал для восстановления возможности выполнять повседневные задачи у людей, страдающих трансрадиальными ампутациями. Однако проблемами, стоящими перед современными моделями управления, является недостаточная устойчивость к нестандартным реальностям и неограниченному разнообразию объектов. Традиционные системы определения захватов строятся на ограниченных данных, в том числе тренировочных базах, которые не могут полностью охватить реальность. Это приводит к значительному снижению точности при определении захватов на неизвестных объектах, что сказывается на доступности и качестве жизни пользователей. Для решения этого, необходимо развитие моделей, которые могут обнаруживать и адаптироваться к новым объектам, не входящим в обучающие наборы.
#### Метод
Мы предлагаем **Grasp-LLaVA**, модель, которая использует технологии графики и языка для точного определения захвата. Она включает в себя три основных компонента: (i) **semantic projection**, которая определяет моделью возможность обобщения на неизвестные объекты; (ii) **Grasp-LLaVA**, где используется гибридное рассуждение, которое моделирует человеческие модели рассуждения для определения типов захвата, основываясь на физических характеристиках объекта; (iii) **Hybrid Grasp Network (HGN)**, система, которая разделяет работу между локальным (edge) и облачным (cloud) вычислениями, обеспечивая быстродействие на реальном времени и точность при необходимости.
#### Результаты
Мы оценили нашу модель на нескольких датасетах, включая набор данных с неизвестными объектами. **Grasp-LLaVA** показала значительное улучшение в сравнении с современными моделями, достигнув 50.2% точности для неизвестных объектов, в то время как лучшие модели современных систем оставались на уровне 36.7%. Благодаря **HGN**, мы достигли значительных улучшений в быстродействии, достигнув 86% усредненной точности на реальных объектах, что является значительной улучшением по сравнению с отдельным использованием моделей или edge-only решений. Добавление **confidence calibration (DC)** позволило повысить точность до 42.3% при работе с неизвестными объектами и уменьшить время вывода на 3.5 раз.
#### Значимость
**Grasp-LLaVA** и **Hybrid Grasp Network (HGN)** открывают новые возможности для улучшения контроля над протезными руками. Они могут быть применены в различных областях, включая лечебную аппаратуру, технологии для людей с ограниченными физическими возможностями и в области робототехники. Интеграция этих моделей в протезы может существенно улучшить их реакцию на новые объекты, предоставив пользователям более простой доступ к действиям в реа
Annotation:
For transradial amputees, robotic prosthetic hands promise to regain the
capability to perform daily living activities. To advance next-generation
prosthetic hand control design, it is crucial to address current shortcomings
in robustness to out of lab artifacts, and generalizability to new
environments. Due to the fixed number of object to interact with in existing
datasets, contrasted with the virtually infinite variety of objects encountered
in the real world, current grasp models perform poo...
Авторы:
Jie Li, Haoye Dong, Zhengyang Wu, Zetao Zheng, Mingrong Lin
## Контекст
Next Point-of-Interest (POI) recommendation является актуальной областью исследований в сфере бизнес-интеллекта. Пользовательские движения по пространству и времени, а также свойства их социальных связей, являются ключевыми факторами, определяющими поведение пользователей. Несмотря на развитие методов рекомендации, существующие подходы часто отдельно моделируют пространственные и временные переходы пользователей, что приводит к несоответствию представлений ключевых точек. Эта несогласованность приводит к добавочной информации при объединении этих представлений, ухудшая точность и увеличивая неопределенность моделей. Наша модель DiMuST (Disentangling Multiplex Spatial-Temporal Transition Graph Representation Learning) предлагает решение этих проблем, создав модель, которая эффективно объединяет пространственные и временные параметры с социальными факторами.
## Метод
Методология DiMuST основывается на дисентролированном представлении мультиплексных пространственно-временных графов. Мы предлагаем Disentangled variational multiplex graph Auto-Encoder (DAE), который разделяет общие и частные дистрибутивы с помощью многоуровневой стратегии графов. Основное отличие заключается в использовании Product of Experts (PoE) для объединения общих функций и внедрении частных данных с помощью контрастивного ограничения. Это позволяет отделить значимые свойства пользовательских переходов и повысить их взаимосвязь. Такая архитектура обеспечивает точное представление переходов пользователей по POI, захватывая спатспово-временные взаимосвязи и социальные связи.
## Результаты
Для проверки эффективности DiMuST проведены эксперименты на двух сложных датасетах. Мы сравнили модель с несколькими современными подходами, включая BERT4Rec, GC-MC и LightGCN. Результаты показали, что DiMuST превосходит другие модели по всем основным метрикам, таким как Recall@20, NDCG@20 и HitRate@20. Эти показатели указывают на устойчивость модели и ее высокую точность в рекомендации POI. Также мы проанализировали вклад каждого компонента модели, чтобы подтвердить эффективность каждой части.
## Значимость
Дисентрольное представление переходов пользователей и их социальных связей в DiMuST демонстрирует существенную полезность в различных сценариях, включая социально ориентированные рекомендации, мобильные сервисы и бизнес-аналитику. Наш подход не только улучшает аккуратность рекомендаций, но и повышает их осмысленность, что может повысить удовлетворенность пользователей. Мы направляемся на дальнейшее расширение DiMuST, включая слияние дополнительных разнородных данных и расширение модели для других типов рекомендаций.
## Выводы
Мы представили DiMuST, модель, которая разделяет пространственные и временные параметры
Annotation:
Next Point-of-Interest (POI) recommendation is a research hotspot in business
intelligence, where users' spatial-temporal transitions and social
relationships play key roles. However, most existing works model spatial and
temporal transitions separately, leading to misaligned representations of the
same spatial-temporal key nodes. This misalignment introduces redundant
information during fusion, increasing model uncertainty and reducing
interpretability. To address this issue, we propose DiMuST,...
Авторы:
Gianluca Bontempi
## Контекст
Современные интеллектуальные агенты, предназначенные для улучшения человеческого опыта и оптимизации процессов, часто сталкиваются с проблемой выравнивания своих ценностей с теми, которые характерны для людей. Этот вопрос, известный как проблема выравнивания (alignment), является одной из самых сложных задач в развитии искусственного интеллекта. Она решается необходимостью создания систем, которые будут соответствовать человеческим ценностям, целям и предпочтениям. Дополнительная сложность заключается в том, что многие человеческие этические ценности являются "немеряными" (incommensurable), то есть нельзя измерить или сравнить напрямую. Например, будучи медицинским агентом, как можно взвесить значение человеческой жизни и стоимость лечения? Этот мотив привел к созданию Ethics2Vec, который предлагает метод представления этических ценностей в виде векторных пространств, позволяющих выравнивать агентские решения с человеческими приоритетами.
## Метод
Ethics2Vec расширяет подход Anything2vec, успешно применяемый в таких областях, как естественно-языковые процессы и рекомендационные системы. Он предлагает преобразовать агентскую стратегию принятия решений в многомерный вектор. Этот вектор можно использовать для сравнения и оценки выравнивания с человеческими ценностями. В первую очередь, метод был применен к агентам, принимающим бинарные решения. Далее, была рассмотрена векторизация автоматического контрольного закона, например, в системах автономного вождения. Это позволяет расширить Ethics2Vec на более сложные ситуации, где решения зависят от многих переменных.
## Результаты
Для проверки концепции были проведены эксперименты с бинарными решениями, в которых Ethics2Vec позволил выявить мотивы и приоритеты, проявляемые агентом. Для комплексных решений, таких как автоматический контроль, было продемонстрировано, как векторное представление может отражать ценности, которые следует учитывать при принятии решений в условиях неопределенности и ситуативных зависимостей. Научные результаты показали, что Ethics2Vec может выступать как инструмент для сравнения различных систем этических решений, а также для оценки того, насколько хорошо агент выравнивает свои решения с человеческими предпочтениями.
## Значимость
Ethics2Vec может быть применен в различных областях, в том числе в медицине, в сфере автоматизированных систем и даже в системах рекомендаций. Его основное преимущество заключается в том, что он предоставляет метрику для оценки ценностных приоритетов, которая может быть использована для выявления проблем в выравнивании и для улучшения решений. Потенциально, это может привести к более мотивированно
Annotation:
Though intelligent agents are supposed to improve human experience (or make
it more efficient), it is hard from a human perspective to grasp the ethical
values which are explicitly or implicitly embedded in an agent behaviour. This
is the well-known problem of alignment, which refers to the challenge of
designing AI systems that align with human values, goals and preferences. This
problem is particularly challenging since most human ethical considerations
refer to \emph{incommensurable} (i.e. no...
Авторы:
Markus Fritzsche, Elliot Gestrin, Jendrik Seipp
## Контекст
На данный момент, трансформеры доказали свою эффективность во многих областях, но их применение в автоматизированном планировании ограничивается. Одним из основных поводов этого являются симметрии в планировании, которые вызывают значительные сложности для обучения. Известный стейт-оф-арт трансформера для автоматизированного планирования, PlanGPT, сталкивается с трудностями при проектировании сложных задач. Это происходит из-за того, что задачи планирования могут быть представлены в различных вариантах, используя произвольные идентификаторы переменных, которые не несут смысла. Это приводит к экспоненциальному росту эквивалентных представлений, которые трансформеры с трудом обучаются. Мы предлагаем новую методологию, основанную на создании более симметричного обучения, чтобы улучшить чувствительность трансформеров к таким симметриям и устранить это ограничение.
## Метод
Мы предлагаем симметрично-подвижную обучающую систему, которая использует современные методы сопоставительного обучения. Эта методология включает в себя архитектурные усовершенствования, позволяющие трансформеру более эффективно обрабатывать симметрии в задачах планирования. Мы применяем специальный контрастирующий целевой функционал, который позволяет трансформеру изучить и отличать задачи с разными симметричными представлениями. Также, мы внедряем дополнительные архитектурные элементы, такие как дополнительные слои и механизмы внимания, для улучшения обработки плановых задач.
## Результаты
Мы проводили эксперименты на нескольких планировании задачах, включая задачи планирования путей и задачи планирования действий. Мы сравнивали наши результаты с PlanGPT и другими моделями. Наши эксперименты показали, что наши трансформеры с симметричным обучением показали значительное улучшение в скорости обучения и точности решения сложных задач. Мы также показали, что модели с нашим методом могут эффективно выделять и использовать симметрии в задачах планирования, что приводит к более точным и эффективным решениям.
## Значимость
Наш метод может быть применен в различных сферах, включая авиацию, производство и робототехнику, где автоматизированное планирование является критически важной задачей. Это решение позволяет использовать трансформеры для задач, где предыдущие модели сталкивались с ограничениями. Благодаря симметричному обучению, наша модель эффективно решает проблемы симметрии и улучшает общую эффективность. Это может привести к повышению производительности и уменьшению времени обучения во многих приложениях.
## Выводы
Annotation:
While transformers excel in many settings, their application in the field of
automated planning is limited. Prior work like PlanGPT, a state-of-the-art
decoder-only transformer, struggles with extrapolation from easy to hard
planning problems. This in turn stems from problem symmetries: planning tasks
can be represented with arbitrary variable names that carry no meaning beyond
being identifiers. This causes a combinatorial explosion of equivalent
representations that pure transformers cannot ef...
Авторы:
Ke Ma, Jun Long, Hongxiao Fei, Liujie Hua, Yueyi Luo
#### Контекст
Предварительно обученные Vision-Language Models (VLMs) широко применяются в задачах обработки изображений и текста. Однако при их использовании в Zero-Shot Anomaly Detection (ZSAD) возникают серьезные проблемы, связанные с отсутствием локальных индуктивных приращений для точной сегментации и статичным подходом к скрещиванию признаков. Эти ограничения приводят к низкой точности и недостаточной устойчивости моделей в задачах детектирования аномалий. Этот аспект подчеркивает необходимость развития более гибких и эффективных архитектур, которые могли бы улучшить процесс адаптации VLMs к ZSAD.
#### Метод
Предлагаемая архитектура Architectural Co-Design состоит из двух основных компонентов. Адаптер Convolutional Low-Rank Adaptation (Conv-LoRA) реализует локальные приращения, улучшая точность представления локальных признаков. Dynamic Fusion Gateway (DFG) вводит динамическую модификацию текстовых признаков, адаптируемую к визуальному контексту. Эти компоненты совмещаются в единой архитектуре, обеспечивающей мощный поиск признаков и гибкий механизм скрещивания. Такой подход позволяет не только улучшить результаты ZSAD, но и достичь высокой устойчивости в различных сценариях применения.
#### Результаты
Исследования проводились на различных датасетах, включая индустриальные и медицинские наборы данных. Предложенная модель показала существенное превосходство по точности и устойчивости по сравнению с современными методами. Эксперименты также подтвердили высокую эффективность Conv-LoRA в точной региональной обработке и DFG в адаптивной модификации признаков. Эти результаты демонстрируют, что сочетание локальной индуктивной модификации и динамического скрещивания признаков является ключевым фактором успеха.
#### Значимость
Предложенный подход может быть применен в различных областях, включая обработку изображений, анализ данных, индустрию и медицину. Он предоставляет преимущества в точности, устойчивости и гибкости. Потенциальное влияние заключается в улучшении адаптации VLMs к задачам ZSAD, что может привести к новым решениям в области ИИ, в том числе для детектирования и раннего обнаружения аномалий.
#### Выводы
Предложенная модель Architectural Co-Design демонстрирует эффективность в ZSAD за счет комбинации Conv-LoRA и DFG. Будущие исследования будут сфокусированы на расширении модели для задач с большим масштабом и уточнении динамических механизмов скрещивания признаков. Это может привести к еще более высокой точности и устойчивости в применении моделей VLMs к задачам детектирования аномалий.
Annotation:
Pre-trained Vision-Language Models (VLMs) face a significant adaptation gap
when applied to Zero-Shot Anomaly Detection (ZSAD), stemming from their lack of
local inductive biases for dense prediction and their reliance on inflexible
feature fusion paradigms. We address these limitations through an Architectural
Co-Design framework that jointly refines feature representation and cross-modal
fusion. Our method integrates a parameter-efficient Convolutional Low-Rank
Adaptation (Conv-LoRA) adapter t...
Авторы:
Hengyu Liu, Yushuai Li, Minghe Yu, Tiancheng Zhang, Ge Yu, Torben Bach Pedersen, Kristian Torp, Christian S. Jensen, Tianyi Li
## Контекст
Квалификационные системы, такие как Massive Open Online Courses (MOOCs), представляют собой новый формат обучения, который позволяет широкому кругу пользователей получать знания онлайн. Одной из важных задач в таких системах является **Knowledge Tracing (KT)** — предсказание познаний учащихся на базе анализа их исторических данных обучения. Это позволяет оценивать их знания в течение времени и адаптировать контент к их потребностям. Однако существующие методы KT часто сталкиваются с проблемами, такими как корреляционные конфликты при анализе последовательностей учебных действий и их влияния на будущие результаты. Эти проблемы могут привести к неточным предсказаниям. Наше исследооание ориентировано на развитие KT-методов, улучшение их точности и учет контекстуальных характеристик учебных последовательностей.
## Метод
Мы предлагаем метод **Forward-Looking Knowledge Tracing (FINER)**, который совершенствует KT за счет использования Follow-up Performance Trends (FPTs) — тенденций постфактум производительности учащихся. FINER включает несколько ключевых компонентов. Во-первых, он **строит обучающие шаблоны** для эффективного восстановления FPTs из исторических данных ITS в линейной сложности. Во-вторых, FINER включает **новую агрегационную механизм акцента**, который учитывает как частоту трендов, так и их контекстуальную связь. Эта механика позволяет лучше интегрировать FPTs в процесс предсказания. В-третьих, FINER объединяет FPTs с историческими последовательностями учебных действий, чтобы обеспечить более точные прогнозы будущих результатов. Эта структура позволяет FINER улучшить точность KT и сделать его более устойчивым к корреляционным проблемам.
## Результаты
Мы провели эксперименты с восьми реальными данными ITS (Massive Open Online Courses) и сравнили FINER с десятью современными KT-методами. Результаты показали, что FINER превосходит другие методы в широком диапазоне, повысив точность предсказания от 8.74% до 84.85% в зависимости от данных. Эти результаты указывают на эффективность FINER в учете контекстуальных трендов и улучшении предсказания познаний учащихся. Мы также доказали, что FPTs дают существенный вклад в улучшение точности, поскольку они аккуратно учитывают характеристики последовательности учебных действий.
## Значимость
FINER может быть применен в различных областях, таких как образовательные платформы, системы учебного анализа и системы экспертного мониторинга. Его преимущества заключаются в улучшении точности прогнозирования, усовершенствовании оценки познаний, а также в устойчивости к ошибкам, связанным с корреляционными проб
Annotation:
Intelligent Tutoring Systems (ITS), such as Massive Open Online Courses,
offer new opportunities for human learning. At the core of such systems,
knowledge tracing (KT) predicts students' future performance by analyzing their
historical learning activities, enabling an accurate evaluation of students'
knowledge states over time. We show that existing KT methods often encounter
correlation conflicts when analyzing the relationships between historical
learning sequences and future performance. To ...
Показано 1601 -
1610
из 1687 записей