GLM-4.5: Agentic, Reasoning, and Coding (ARC) Foundation Models

2508.06471v1 cs.CL 2025-08-12
Авторы:

GLM-4. 5 Team, :, Aohan Zeng, Xin Lv, Qinkai Zheng, Zhenyu Hou, Bin Chen, Chengxing Xie, Cunxiang Wang, Da Yin, Hao Zeng, Jiajie Zhang, Kedong Wang, Lucen Zhong, Mingdao Liu, Rui Lu, Shulin Cao, Xiaohan Zhang, Xuancheng Huang, Yao Wei, Yean Cheng, Yifan An, Yilin Niu, Yuanhao Wen, Yushi Bai, Zhengxiao Du, Zihan Wang, Zilin Zhu, Bohan Zhang, Bosi Wen, Bowen Wu, Bowen Xu, Can Huang, Casey Zhao, Changpeng Cai, Chao Yu, Chen Li, Chendi Ge, Chenghua Huang, Chenhui Zhang, Chenxi Xu, Chenzheng Zhu, Chuang Li, Congfeng Yin, Daoyan Lin, Dayong Yang, Dazhi Jiang, Ding Ai, Erle Zhu, Fei Wang, Gengzheng Pan, Guo Wang, Hailong Sun, Haitao Li, Haiyang Li, Haiyi Hu, Hanyu Zhang, Hao Peng, Hao Tai, Haoke Zhang, Haoran Wang, Haoyu Yang, He Liu, He Zhao, Hongwei Liu, Hongxi Yan, Huan Liu, Huilong Chen, Ji Li, Jiajing Zhao, Jiamin Ren, Jian Jiao, Jiani Zhao, Jianyang Yan, Jiaqi Wang, Jiayi Gui, Jiayue Zhao, Jie Liu, Jijie Li, Jing Li, Jing Lu, Jingsen Wang, Jingwei Yuan, Jingxuan Li, Jingzhao Du, Jinhua Du, Jinxin Liu, Junkai Zhi, Junli Gao, Ke Wang, Lekang Yang, Liang Xu, Lin Fan, Lindong Wu, Lintao Ding, Lu Wang, Man Zhang, Minghao Li, Minghuan Xu, Mingming Zhao, Mingshu Zhai, Pengfan Du, Qian Dong, Shangde Lei, Shangqing Tu, Shangtong Yang, Shaoyou Lu, Shijie Li, Shuang Li, Shuang-Li, Shuxun Yang, Sibo Yi, Tianshu Yu, Wei Tian, Weihan Wang, Wenbo Yu, Weng Lam Tam, Wenjie Liang, Wentao Liu, Xiao Wang, Xiaohan Jia, Xiaotao Gu, Xiaoying Ling, Xin Wang, Xing Fan, Xingru Pan, Xinyuan Zhang, Xinze Zhang, Xiuqing Fu, Xunkai Zhang, Yabo Xu, Yandong Wu, Yida Lu, Yidong Wang, Yilin Zhou, Yiming Pan, Ying Zhang, Yingli Wang, Yingru Li, Yinpei Su, Yipeng Geng, Yitong Zhu, Yongkun Yang, Yuhang Li, Yuhao Wu, Yujiang Li, Yunan Liu, Yunqing Wang, Yuntao Li, Yuxuan Zhang, Zezhen Liu, Zhen Yang, Zhengda Zhou, Zhongpei Qiao, Zhuoer Feng, Zhuorui Liu, Zichen Zhang, Zihan Wang, Zijun Yao, Zikang Wang, Ziqiang Liu, Ziwei Chai, Zixuan Li, Zuodong Zhao, Wenguang Chen, Jidong Zhai, Bin Xu, Minlie Huang, Hongning Wang, Juanzi Li, Yuxiao Dong, Jie Tang

Резюме на русском

## Контекст GLM-4.5 стремится стать одним из ведущих моделей микса экспертов (MoE) в области бо LLM, сочетая в себе мощь крупных языковых моделей с новыми подходами к моделированию разума и автоматизированного программирования. Основные проблемы, которые она пытается решить, заключаются в ограниченности текущих моделей в человеческом разуме и недостаточности в выполнении сложных логических задач. Благодаря своему гибкому подходу и высокой скорости обработки, GLM-4.5 предлагает новый подход к решению этих проблем, включая понимание естественного языка, кодирование и агентное поведение. ## Метод GLM-4.5 использует модель MoE с 355 миллиардами параметров, но только 32 миллиарда из них активируются при выполнении задач. Она использует гибкий подход к гибридной рассуждающей системе, включая thinking и direct response режимы. На стадии обучения во время тренировочного процесса на 23 тонн текстовых данных, а также после тренировки с использованием экспертных моделей и повышения через reinforcement learning, модель достигает отличных результатов в многих зонах прикладных задач. ## Результаты GLM-4.5 показывает очень высокую эффективность в тестах, таких как TAU-Bench, AIME 24 и SWE-Bench. Она занимает третье место среди всех изучаемых моделей, а в зоне agentic benchmarks — второе место. Несмотря на это, содержит значительно меньше параметров, чем многие соревновательные модели, что делает её более эффективной в производительности и ресурсами. Оба выпуска — GLM-4.5 (355B) и сокращенная версия GLM-4.5-Air (106B) — доступны для улучшения исследований в области логического робота и агентных AI-систем. ## Значимость GLM-4.5 имеет широкие приложения в сфере образования, программирования, диагностики и автоматизации решений в различных областях. Её мощность и эффективность делают её уникальной в сравнении с другими моделями, которые часто требуют больших ресурсов. Главное преимущество — способность гибко адаптироваться к различным задачам без необходимости выделения большого объёма ресурсов. ## Выводы Данная работа показывает, что GLM-4.5 является мощным инструментом для продвижения AI в области моделирования логического разума и кодирования. Будущие исследования будут сконцентрированы на улучшении гибких методов моделирования и применении модели в реальных задачах, включая сложные задачи программирования и понимания естественного языка.

Abstract

We present GLM-4.5, an open-source Mixture-of-Experts (MoE) large language model with 355B total parameters and 32B activated parameters, featuring a hybrid reasoning method that supports both thinking and direct response modes. Through multi-stage training on 23T tokens and comprehensive post-training with expert model iteration and reinforcement learning, GLM-4.5 achieves strong performance across agentic, reasoning, and coding (ARC) tasks, scoring 70.1% on TAU-Bench, 91.0% on AIME 24, and 64.2% on SWE-bench Verified. With much fewer parameters than several competitors, GLM-4.5 ranks 3rd overall among all evaluated models and 2nd on agentic benchmarks. We release both GLM-4.5 (355B parameters) and a compact version, GLM-4.5-Air (106B parameters), to advance research in reasoning and agentic AI systems. Code, models, and more information are available at https://github.com/zai-org/GLM-4.5.

Ссылки и действия