A Transformer-Based Cross-Platform Analysis of Public Discourse on the 15-Minute City Paradigm

2509.11443v1 cs.CL, cs.SI 2025-09-17
Авторы:

Gaurab Chhetri, Darrell Anderson, Boniphace Kutela, Subasish Das

Резюме на русском

################################# ## Контекст ################################# Основная цель исследования — изучить публичное мнение о 15-минутном городе, анализируя данные из различных источников: Twitter, Reddit и новостных сайтов. Этот подход позволяет изучить различные аспекты этой идеи в разных форматах текста: длинных сообщениях, коротких сообщениях и новостных статьях. Область 15-минутного города — это новая концепция, предлагающая, чтобы все жители города могли достичь работы, дома, магазинов, школ и развлечений в пределах 15 минут ходьбы или велосипедной поездки. Хотя эта идея привлекает внимание в мировой публичности, существуют разногласия относительно ее реализации и последствий. Некоторые считают, что это может улучшить качество жизни и снизить загрязнение окружающей среды, в то время как другие выражают беспокойство о возможных ограничениях свободы и необходимости перестройки городских структур. Данное исследование предлагает многоплатформенный подход к анализу этих точек зрения, чтобы понять, как мнение меняется в зависимости от источника текста. ################################# ## Метод ################################# Для анализа был разработан концептуальный конвейер, объединяющий несколько технических решений. Использовались компрессированные модели трансформера для классификации тональности текста. Основная модель — Llama-3-8B — использовалась для аннотации данных. Изучались длинные и краткие тексты, чтобы обеспечить поддержку различных форматов сообщений. Для оценки качества работы конвейера были использованы пять моделей классификации: DistilRoBERTa, DistilBERT, MiniLM, ELECTRA и TinyBERT. Для качественного сравнения этих моделей был применен стратифицированный 5-кратный метод кросс-валидации. Оценкой качества стали F1-меры, AUC и время обучения. ################################# ## Результаты ################################# Проведение экспериментов показало, что DistilRoBERTa демонстрирует наивысшую точность с F1-мерой 0.8292. TinyBERT, в свою очередь, проявила себя как наиболее эффективная в плане скорости. MiniLM, помимо высокой точности, показала наилучшую устойчивость к разным платформам. В целом, новостные данные демонстрируют высокую точность в плане классификации, но страдают от проблемы несбалансированных классов. Reddit теряет в качестве из-за суммирования сообщений, что приводит к потере контекста. Twitter, в свою очередь, представляет умеренную сложность. ################################# ## Значимость ################################# Результаты этого исследования могут быть применены в многочисленных областях, включая градостроительство, коммуникацию и моделирование мнений. Изучение публичного мнения помогает городским властям понять реакцию граждан на идею 15-минутного города и выработа

Abstract

This study presents the first multi-platform sentiment analysis of public opinion on the 15-minute city concept across Twitter, Reddit, and news media. Using compressed transformer models and Llama-3-8B for annotation, we classify sentiment across heterogeneous text domains. Our pipeline handles long-form and short-form text, supports consistent annotation, and enables reproducible evaluation. We benchmark five models (DistilRoBERTa, DistilBERT, MiniLM, ELECTRA, TinyBERT) using stratified 5-fold cross-validation, reporting F1-score, AUC, and training time. DistilRoBERTa achieved the highest F1 (0.8292), TinyBERT the best efficiency, and MiniLM the best cross-platform consistency. Results show News data yields inflated performance due to class imbalance, Reddit suffers from summarization loss, and Twitter offers moderate challenge. Compressed models perform competitively, challenging assumptions that larger models are necessary. We identify platform-specific trade-offs and propose directions for scalable, real-world sentiment classification in urban planning discourse.

Ссылки и действия