📊 Статистика дайджестов

Всего дайджестов: 34607 Добавлено сегодня: 484

Последнее обновление: сегодня

📄 Transparent Semantic Spaces: A Categorical Approach to Explainable Word Embeddings

2025-08-30

Авторы:

Ares Fabregat-Hernández, Javier Palanca, Vicent Botti

#### Контекст Область исследования артифициального интеллекта (AI) становится все более важной в современном мире, где AI применяется во многих сферах жизнедеятельности. Одна из проблем, характерной для AI, является непонятность решений, принятых нейронными сетями, что препятствует их широкому применению в критичных областях, таких как медицина, финансы и законодательство. Это называется "черным ящиком" проблемой. Word embeddings, которые являются основополагающим элементом AI, также представляют собой непонятные структуры, которые требуют объяснения. Мы предлагаем новый подход, основанный на категориальной теории, для создания понятных семантических пространств, которые могут обеспечить лучшую транспарентность и объясняемость в AI. #### Метод Мы предлагаем категориальную модель для построения семантических пространств, которая работает с любым размером данных. Мы вводим два новых понятия: $\mathcal{L}_T$ и $\mathcal{P}_T$, которые представляют собой схематические представления семантики текста $T$. Мы также определяем $\mathcal{P}_T$ как моноидальную категорию, что позволяет работать с данными независимо от их размерности. Мы также вводим два новых понятия: Conf и $\mathcal{Emb}$, которые определяются как категории, а дивергенция используется как декорация на $\mathcal{Emb}$. Это позволяет сравнивать разные модели word embeddings, такие как GloVe и Word2Vec, с метрическим методом MDS, превращая нейронные сетевые модели в прозрачный и понятный фреймворк. #### Результаты Мы проводим эксперименты с двумя разными наборами данных: текстовыми данными и семантическими пространствами. Мы показываем, что наша категориальная модель дает лучший понятный результат в сравнении с традиционными методами. Мы также показываем, что наш подход позволяет корректно сравнивать разные модели word embeddings, и демонстрируем, что GloVe и Word2Vec могут быть представлены в категориальных системах. Наши результаты показывают, что наш подход может обеспечить лучшую транспарентность и понятность в AI. #### Значимость Наш подход имеет широкие области применения, в частности, в области explainable AI, где необходимо объяснить решения, принимаемые нейронными сетями. Мы также видим применение нашего подхода в области машинного обучения, где необходимо понять, как работают модели. Мы показываем, что наша модель позволяет избежать "черного ящика" проблемы и дает более глубокое понимание семантических структур. Это может привести к более надежным и безопасным AI-системам. #### Выводы Мы предложили новый категориальный подход для построения транспарентных семантических пространств, который может быть использован для объяснения решений, принимаемых AI-

Annotation:

The paper introduces a novel framework based on category theory to enhance the explainability of artificial intelligence systems, particularly focusing on word embeddings. Key topics include the construction of categories $\mathcal{L}_T$ and $\mathcal{P}_T$, providing schematic representations of the semantics of a text $ T $, and reframing the selection of the element with maximum probability as a categorical notion. Additionally, the monoidal category $\mathcal{P}_T$ is constructed to visualiz...

ID: 2508.20701v1 cs.AI, cs.CL, math.CT

arXiv PDF