GLM-5: from Vibe Coding to Agentic Engineering

GLM-5-Team: Aohan Zeng; Xin Lv; Zhenyu Hou; Zhengxiao Du; Qinkai Zheng; Bin Chen; Da Yin; Chendi Ge; Chenghua Huang; Chengxing Xie; Chenzheng Zhu; Congfeng Yin; Cunxiang Wang; Gengzheng Pan; Hao Zeng; Haoke Zhang; Haoran Wang; Huilong Chen; Jiajie Zhang; Jian Jiao; Jiaqi Guo; Jingsen Wang; Jingzhao Du; Jinzhu Wu; Kedong Wang; Lei Li; Lin Fan; Lucen Zhong; Mingdao Liu; Mingming Zhao; Pengfan Du; Qian Dong; Rui Lu; Shuang-Li; Shulin Cao; Song Liu; Ting Jiang; Xiaodong Chen; Xiaohan Zhang; Xuancheng Huang; Xuezhen Dong; Yabo Xu; Yao Wei; Yifan An; Yilin Niu; Yitong Zhu; Yuanhao Wen; Yukuo Cen; Yushi Bai; Zhongpei Qiao; Zihan Wang; Zikang Wang; Zilin Zhu; Ziqiang Liu; Zixuan Li; Bojie Wang; Bosi Wen; Can Huang; Changpeng Cai; Chao Yu; Chen Li; Chengwei Hu; Chenhui Zhang; Dan Zhang; Daoyan Lin; Dayong Yang; Di Wang; Ding Ai; Erle Zhu; Fangzhou Yi; Feiyu Chen; Guohong Wen; Hailong Sun; Haisha Zhao; Haiyi Hu; Hanchen Zhang; Hanrui Liu; Hanyu Zhang; Hao Peng; Hao Tai; Haobo Zhang; He Liu; Hongwei Wang; Hongxi Yan; Hongyu Ge; Huan Liu; Huanpeng Chu; Jia'ni Zhao; Jiachen Wang; Jiajing Zhao; Jiamin Ren; Jiapeng Wang; Jiaxin Zhang; Jiayi Gui; Jiayue Zhao; Jijie Li; Jing An; Jing Li; Jingwei Yuan; Jinhua Du; Jinxin Liu; Junkai Zhi; Junwen Duan; Kaiyue Zhou; Kangjian Wei; Ke Wang; Keyun Luo; Laiqiang Zhang; Leigang Sha; Liang Xu; Lindong Wu; Lintao Ding; Lu Chen; Minghao Li; Nianyi Lin; Pan Ta; Qiang Zou; Rongjun Song; Ruiqi Yang; Shangqing Tu; Shangtong Yang; Shaoxiang Wu; Shengyan Zhang; Shijie Li; Shuang Li; Shuyi Fan; Wei Qin; Wei Tian; Weining Zhang; Wenbo Yu; Wenjie Liang; Xiang Kuang; Xiangmeng Cheng; Xiangyang Li; Xiaoquan Yan; Xiaowei Hu; Xiaoying Ling; Xing Fan; Xingye Xia; Xinyuan Zhang; Xinze Zhang; Xirui Pan; Xu Zou; Xunkai Zhang; Yadi Liu; Yandong Wu; Yanfu Li; Yidong Wang; Yifan Zhu; Yijun Tan; Yilin Zhou; Yiming Pan; Ying Zhang; Yinpei Su; Yipeng Geng; Yong Yan; Yonglin Tan; Yuean Bi; Yuhan Shen; Yuhao Yang; Yujiang Li; Yunan Liu; Yunqing Wang; Yuntao Li; Yurong Wu; Yutao Zhang; Yuxi Duan; Yuxuan Zhang; Zezhen Liu; Zhengtao Jiang; Zhenhe Yan; Zheyu Zhang; Zhixiang Wei; Zhuo Chen; Zhuoer Feng; Zijun Yao; Ziwei Chai; Ziyuan Wang; Zuzhou Zhang; Bin Xu; Minlie Huang; Hongning Wang; Juanzi Li; Yuxiao Dong; Jie Tang

arXiv:2602.15763·cs.LG·February 25, 2026

GLM-5: from Vibe Coding to Agentic Engineering

GLM-5-Team: Aohan Zeng, Xin Lv, Zhenyu Hou, Zhengxiao Du, Qinkai Zheng, Bin Chen, Da Yin, Chendi Ge, Chenghua Huang, Chengxing Xie, Chenzheng Zhu, Congfeng Yin, Cunxiang Wang, Gengzheng Pan, Hao Zeng, Haoke Zhang, Haoran Wang, Huilong Chen, Jiajie Zhang, Jian Jiao, Jiaqi Guo

PDF

Open Access 6 Models 1 Datasets

TL;DR

GLM-5 is a cutting-edge foundation model that advances vibe coding to agentic engineering, featuring cost-efficient training, improved autonomy, and superior performance in complex coding tasks.

Contribution

The paper introduces GLM-5, a novel foundation model with DSA-based training, asynchronous reinforcement learning infrastructure, and new RL algorithms for enhanced long-horizon interaction learning.

Findings

01

Achieves state-of-the-art performance on major benchmarks.

02

Demonstrates superior capability in real-world coding tasks.

03

Reduces training and inference costs significantly.

Abstract

We present GLM-5, a next-generation foundation model designed to transition the paradigm of vibe coding to agentic engineering. Building upon the agentic, reasoning, and coding (ARC) capabilities of its predecessor, GLM-5 adopts DSA to significantly reduce training and inference costs while maintaining long-context fidelity. To advance model alignment and autonomy, we implement a new asynchronous reinforcement learning infrastructure that drastically improves post-training efficiency by decoupling generation from training. Furthermore, we propose novel asynchronous agent RL algorithms that further improve RL quality, enabling the model to learn from complex, long-horizon interactions more effectively. Through these innovations, GLM-5 achieves state-of-the-art performance on major open benchmarks. Most critically, GLM-5 demonstrates unprecedented capability in real-world coding tasks,…

Peer Reviews

No public reviews on file for this paper yet. If you reviewed it on a platform where reviews are public (OpenReview, ICLR, NeurIPS, ICML), you can paste yours below so the community can read it here.

Code & Models

Models

Datasets

zai-org/terminal-bench-2-verified
dataset· 1.8k dl
1.8k dl

Videos

No videos yet. Explain this paper in a talk, walkthrough, or lecture? Add one.

Taxonomy

TopicsReinforcement Learning in Robotics · Multimodal Machine Learning Applications · Generative Adversarial Networks and Image Synthesis