A Transformer-Based Cross-Platform Analysis of Public Discourse on the 15-Minute City Paradigm
2509.11443v1
cs.CL, cs.SI
2025-09-17
Авторы:
Gaurab Chhetri, Darrell Anderson, Boniphace Kutela, Subasish Das
Резюме на русском
#################################
## Контекст
#################################
Основная цель исследования — изучить публичное мнение о 15-минутном городе, анализируя данные из различных источников: Twitter, Reddit и новостных сайтов. Этот подход позволяет изучить различные аспекты этой идеи в разных форматах текста: длинных сообщениях, коротких сообщениях и новостных статьях.
Область 15-минутного города — это новая концепция, предлагающая, чтобы все жители города могли достичь работы, дома, магазинов, школ и развлечений в пределах 15 минут ходьбы или велосипедной поездки. Хотя эта идея привлекает внимание в мировой публичности, существуют разногласия относительно ее реализации и последствий. Некоторые считают, что это может улучшить качество жизни и снизить загрязнение окружающей среды, в то время как другие выражают беспокойство о возможных ограничениях свободы и необходимости перестройки городских структур.
Данное исследование предлагает многоплатформенный подход к анализу этих точек зрения, чтобы понять, как мнение меняется в зависимости от источника текста.
#################################
## Метод
#################################
Для анализа был разработан концептуальный конвейер, объединяющий несколько технических решений. Использовались компрессированные модели трансформера для классификации тональности текста. Основная модель — Llama-3-8B — использовалась для аннотации данных. Изучались длинные и краткие тексты, чтобы обеспечить поддержку различных форматов сообщений.
Для оценки качества работы конвейера были использованы пять моделей классификации: DistilRoBERTa, DistilBERT, MiniLM, ELECTRA и TinyBERT. Для качественного сравнения этих моделей был применен стратифицированный 5-кратный метод кросс-валидации. Оценкой качества стали F1-меры, AUC и время обучения.
#################################
## Результаты
#################################
Проведение экспериментов показало, что DistilRoBERTa демонстрирует наивысшую точность с F1-мерой 0.8292. TinyBERT, в свою очередь, проявила себя как наиболее эффективная в плане скорости. MiniLM, помимо высокой точности, показала наилучшую устойчивость к разным платформам.
В целом, новостные данные демонстрируют высокую точность в плане классификации, но страдают от проблемы несбалансированных классов. Reddit теряет в качестве из-за суммирования сообщений, что приводит к потере контекста. Twitter, в свою очередь, представляет умеренную сложность.
#################################
## Значимость
#################################
Результаты этого исследования могут быть применены в многочисленных областях, включая градостроительство, коммуникацию и моделирование мнений. Изучение публичного мнения помогает городским властям понять реакцию граждан на идею 15-минутного города и выработа
Abstract
This study presents the first multi-platform sentiment analysis of public
opinion on the 15-minute city concept across Twitter, Reddit, and news media.
Using compressed transformer models and Llama-3-8B for annotation, we classify
sentiment across heterogeneous text domains. Our pipeline handles long-form and
short-form text, supports consistent annotation, and enables reproducible
evaluation. We benchmark five models (DistilRoBERTa, DistilBERT, MiniLM,
ELECTRA, TinyBERT) using stratified 5-fold cross-validation, reporting
F1-score, AUC, and training time. DistilRoBERTa achieved the highest F1
(0.8292), TinyBERT the best efficiency, and MiniLM the best cross-platform
consistency. Results show News data yields inflated performance due to class
imbalance, Reddit suffers from summarization loss, and Twitter offers moderate
challenge. Compressed models perform competitively, challenging assumptions
that larger models are necessary. We identify platform-specific trade-offs and
propose directions for scalable, real-world sentiment classification in urban
planning discourse.
Ссылки и действия
Дополнительные ресурсы: