Kimi K2: Open Agentic Intelligence

Kimi Team: Yifan Bai; Yiping Bao; Y. Charles; Cheng Chen; Guanduo Chen; Haiting Chen; Huarong Chen; Jiahao Chen; Ningxin Chen; Ruijue Chen; Yanru Chen; Yuankun Chen; Yutian Chen; Zhuofu Chen; Jialei Cui; Hao Ding; Mengnan Dong; Angang Du; Chenzhuang Du; Dikang Du; Yulun Du; Yu Fan; Yichen Feng; Kelin Fu; Bofei Gao; Chenxiao Gao; Hongcheng Gao; Peizhong Gao; Tong Gao; Yuyao Ge; Shangyi Geng; Qizheng Gu; Xinran Gu; Longyu Guan; Haiqing Guo; Jianhang Guo; Xiaoru Hao; Tianhong He; Weiran He; Wenyang He; Yunjia He; Chao Hong; Hao Hu; Yangyang Hu; Zhenxing Hu; Weixiao Huang; Zhiqi Huang; Zihao Huang; Tao Jiang; Zhejun Jiang; Xinyi Jin; Yongsheng Kang; Guokun Lai; Cheng Li; Fang Li; Haoyang Li; Ming Li; Wentao Li; Yang Li; Yanhao Li; Yiwei Li; Zhaowei Li; Zheming Li; Hongzhan Lin; Xiaohan Lin; Zongyu Lin; Chengyin Liu; Chenyu Liu; Hongzhang Liu; Jingyuan Liu; Junqi Liu; Liang Liu; Shaowei Liu; T.Y. Liu; Tianwei Liu; Weizhou Liu; Yangyang Liu; Yibo Liu; Yiping Liu; Yue Liu; Zhengying Liu; Enzhe Lu; Haoyu Lu; Lijun Lu; Yashuo Luo; Shengling Ma; Xinyu Ma; Yingwei Ma; Shaoguang Mao; Jie Mei; Xin Men; Yibo Miao; Siyuan Pan; Yebo Peng; Ruoyu Qin; Zeyu Qin; Bowen Qu; Zeyu Shang; Lidong Shi; Shengyuan Shi; Feifan Song; Jianlin Su; Zhengyuan Su; Lin Sui; Xinjie Sun; Flood Sung; Yunpeng Tai; Heyi Tang; Jiawen Tao; Qifeng Teng; Chaoran Tian; Chensi Wang; Dinglu Wang; Feng Wang; Hailong Wang; Haiming Wang; Jianzhou Wang; Jiaxing Wang; Jinhong Wang; Shengjie Wang; Shuyi Wang; Si Wang; Xinyuan Wang; Yao Wang; Yejie Wang; Yiqin Wang; Yuxin Wang; Yuzhi Wang; Zhaoji Wang; Zhengtao Wang; Zhengtao Wang; Zhexu Wang; Chu Wei; Qianqian Wei; Haoning Wu; Wenhao Wu; Xingzhe Wu; Yuxin Wu; Chenjun Xiao; Jin Xie; Xiaotong Xie; Weimin Xiong; Boyu Xu; Jinjing Xu; L.H. Xu; Lin Xu; Suting Xu; Weixin Xu; Xinran Xu; Yangchuan Xu; Ziyao Xu; Jing Xu; Jing Xu; Junjie Yan; Yuzi Yan; Hao Yang; Xiaofei Yang; Yi Yang; Ying Yang; Zhen Yang; Zhilin Yang; Zonghan Yang; Haotian Yao; Xingcheng Yao; Wenjie Ye; Zhuorui Ye; Bohong Yin; Longhui Yu; Enming Yuan; Hongbang Yuan; Mengjie Yuan; Siyu Yuan; Haobing Zhan; Dehao Zhang; Hao Zhang; Wanlu Zhang; Xiaobin Zhang; Yadong Zhang; Yangkun Zhang; Yichi Zhang; Yizhi Zhang; Yongting Zhang; Yu Zhang; Yutao Zhang; Yutong Zhang; Zheng Zhang; Haotian Zhao; Yikai Zhao; Zijia Zhao; Huabin Zheng; Shaojie Zheng; Longguang Zhong; Jianren Zhou; Xinyu Zhou; Zaida Zhou; Jinguo Zhu; Zhen Zhu; Weiyu Zhuang; Xinxing Zu

arXiv:2507.20534·cs.LG·February 4, 2026

Kimi K2: Open Agentic Intelligence

Kimi Team: Yifan Bai, Yiping Bao, Y. Charles, Cheng Chen, Guanduo Chen, Haiting Chen, Huarong Chen, Jiahao Chen, Ningxin Chen, Ruijue Chen, Yanru Chen, Yuankun Chen, Yutian Chen, Zhuofu Chen, Jialei Cui, Hao Ding, Mengnan Dong, Angang Du, Chenzhuang Du, Dikang Du, Yulun Du

PDF

TL;DR

Kimi K2 is a large open-source language model with 32 billion parameters, enhanced by a novel optimizer and training pipeline, achieving state-of-the-art agentic and reasoning capabilities without extended thinking.

Contribution

Introduction of Kimi K2, a large-scale open-source model with a new optimizer and training process, advancing agentic and reasoning abilities in open models.

Findings

01

Achieved top performance on multiple benchmarks.

02

Demonstrated strong coding, math, and reasoning skills.

03

Surpassed most open and closed models in non-thinking tasks.

Abstract

We introduce Kimi K2, a Mixture-of-Experts (MoE) large language model with 32 billion activated parameters and 1 trillion total parameters. We propose the MuonClip optimizer, which improves upon Muon with a novel QK-clip technique to address training instability while enjoying the advanced token efficiency of Muon. Based on MuonClip, K2 was pre-trained on 15.5 trillion tokens with zero loss spike. During post-training, K2 undergoes a multi-stage post-training process, highlighted by a large-scale agentic data synthesis pipeline and a joint reinforcement learning (RL) stage, where the model improves its capabilities through interactions with real and synthetic environments. Kimi K2 achieves state-of-the-art performance among open-source non-thinking models, with strengths in agentic capabilities. Notably, K2 obtains 66.1 on Tau2-Bench, 76.5 on ACEBench (En), 65.8 on SWE-Bench Verified,…

Peer Reviews

No public reviews on file for this paper yet. If you reviewed it on a platform where reviews are public (OpenReview, ICLR, NeurIPS, ICML), you can paste yours below so the community can read it here.

Videos

No videos yet. Explain this paper in a talk, walkthrough, or lecture? Add one.