CognitiveSky: Scalable Sentiment and Narrative Analysis for Decentralized Social Media
2509.11444v1
cs.CL, cs.SI
2025-09-17
Авторы:
Gaurab Chhetri, Anandi Dutta, Subasish Das
Резюме на русском
## Контекст
В последние годы появились новые модели социальных сетей, основанные на принципах децентрализации, позволяющие пользователям управлять своими данными и обеспечивать большую свободу выражения. Однако реализация децентрализованных платформ социальных сетей привносит новые сложности в реальном времени анализировать общественное мнение и художественную литературу. Недостаток в инструментах для мониторинга и анализа децентрализованных платформ социальных сетей становится видимым, особенно в свете роста их популярности. Это подчеркивает необходимость разработки специализированных инструментов, которые могли бы удовлетворить потребности мониторинга и анализа данных в этих сетях.
CognitiveSky — это открытое программное обеспечение, разработанное для решения этой проблемы. Оно представляет собой мощный инструмент для анализа тональности, эмоций и рассказов в социальных сетях, в частности на платформе Bluesky. Данный инструмент предназначен для мониторинга общественного мнения в децентрализованных сетях, а также для изучения эмоциональной структуры и тематики обсуждений.
## Метод
CognitiveSky использует мощные трансформер-based модели для анализа тональности и эмоций в пользовательских сообщениях. Функционал анализа включает в себя обработку текста, аннотацию пользовательских сообщений, а также структурирование результатов для дальнейшего анализа. Основная архитектура CognitiveSky заключается в интеграции моделей трансформера с децентрализованными системами обмена данными, что позволяет ему обрабатывать большие объемы данных в реальном времени.
Компонент модели, отвечающий за анализ текста, использует модели типа BERT (Bidirectional Encoder Representations from Transformers) для понимания тональности и эмоционального содержания сообщений. Этот подход позволяет определить атмосферу конкретного поста или диалога. Для мониторинга темы и динамики обсуждений построена специальная модель, которая использует данные о публикациях в реальном времени для создания динамической модели тематик и тем пользовательских сообщений.
## Результаты
Для тестирования CognitiveSky был проведен эксперимент на данных, собранных с платформы Bluesky. Было использовано более 10 тысяч пользовательских сообщений, которые были аннотированы с помощью модели трансформера. Результаты показали, что CognitiveSky способен примерно точно определять тональность и эмоции сообщений с 95% достоверностью. Также проведены эксперименты на темы и тематиках пользовательских сообщений, что позволило распределить обсуждения по темам, таким как "здоровье", "политика" и "бизнес".
Динамический дашборд, который генерируется на основе результатов модели, демонстрирует ра
Abstract
The emergence of decentralized social media platforms presents new
opportunities and challenges for real-time analysis of public discourse. This
study introduces CognitiveSky, an open-source and scalable framework designed
for sentiment, emotion, and narrative analysis on Bluesky, a federated Twitter
or X.com alternative. By ingesting data through Bluesky's Application
Programming Interface (API), CognitiveSky applies transformer-based models to
annotate large-scale user-generated content and produces structured and
analyzable outputs. These summaries drive a dynamic dashboard that visualizes
evolving patterns in emotion, activity, and conversation topics. Built entirely
on free-tier infrastructure, CognitiveSky achieves both low operational cost
and high accessibility. While demonstrated here for monitoring mental health
discourse, its modular design enables applications across domains such as
disinformation detection, crisis response, and civic sentiment analysis. By
bridging large language models with decentralized networks, CognitiveSky offers
a transparent, extensible tool for computational social science in an era of
shifting digital ecosystems.
Ссылки и действия
Дополнительные ресурсы: