Every Activation Boosted: Scaling General Reasoner to 1 Trillion Open Language Foundation

Ling Team; Ang Li; Ben Liu; Binbin Hu; Bing Li; Bingwei Zeng; Borui Ye; Caizhi Tang; Changxin Tian; Chao Huang; Chao Zhang; Chen Qian; Chenchen Ju; Chenchen Li; Chengfu Tang; Chilin Fu; Chunshao Ren; Chunwei Wu; Cong Zhang; Cunyin Peng; Dafeng Xu; Daixin Wang; Dalong Zhang; Dingnan Jin; Dingyuan Zhu; Dongke Hu; Fangzheng Zhao; Feifan Wu; Feng Zhu; Gangshan Wang; Haitao Zhang; Hailin Zhao; Hanxiao Zhang; Hanzi Wang; Hao Qian; Haoyi Yu; Heng Zhang; Hongliang Zhang; Hongzhi Luan; Huirong Dong; Huizhong Li; Jia Li; Jia Liu; Jialong Zhu; Jian Sha; Jianping Wei; Jiaolong Yang; Jieyue Ma; Jiewei Wu; Jinjing Huang; Jingyun Tian; Jingyuan Zhang; Jinquan Sun; Juanhui Tu; Jun Liu; Jun Xu; Jun Zhou; Junjie Ou; Junpeng Fang; Kaihong Zhang; Kaiqin Hu; Ke Shi; Kun Tang; Kunlong Chen; Lanyin Mei; Lei Liang; Lei Xu; Libo Zhang; Lin Ju; Lin Yuan; Ling Zhong; Lintao Ma; Lu Liu; Lu Yu; Lun Cai; Meiqi Zhu; Mengying Li; Min Chen; Minghao Xue; Minghong Cai; Mingming Yin; Peijie Jiang; Peilong Zhao; Pingping Liu; Qian Zhao; Qing Cui; Qingxiang Huang; Qingyuan Yang; Quankun Yu; Shaowei Wei; Shijie Lian; Shoujian Zheng; Shun Song; Shungen Zhang; Shuo Zhang; Siyuan Li; Song Liu; Ting Guo; Tong Zhao; Wanli Gu; Weichang Wu; Weiguang Han; Wenjing Fang; Wubin Wang; Xiang Shu; Xiao Shi; Xiaoshun Lan; Xiaolu Zhang; Xiaqing Sun; Xin Zhao; Xingyu Lu; Xiong Xu; Xudong Wang; Xudong Wang; Xuemin Yang; Yajie Yang; Yang Xiang; Yanzhe Li; Yi Zhang; Yilong Wang; Yingxue Li; Yongzhen Guo; Yuzhuo Fu; Yuanyuan Wang; Yue Yang; Yue Yu; Yufeng Deng; Yun Zhang; Yunfei Yu; Yuqi Zhang; Yuxiao He; Zengke Gui; Zhaoxin Huan; Zhaoyang Wang; Zhibo Zhu; Zhihao Wang; Zhiqiang Zhang; Zhoufei Wang; Zihang Zeng; Ziqi Liu; Zitao Xuan; Zuoli Tang

arXiv:2510.22115·cs.CL·November 10, 2025

Every Activation Boosted: Scaling General Reasoner to 1 Trillion Open Language Foundation

Ling Team, Ang Li, Ben Liu, Binbin Hu, Bing Li, Bingwei Zeng, Borui Ye, Caizhi Tang, Changxin Tian, Chao Huang, Chao Zhang, Chen Qian, Chenchen Ju, Chenchen Li, Chengfu Tang, Chilin Fu, Chunshao Ren, Chunwei Wu, Cong Zhang, Cunyin Peng, Dafeng Xu, Daixin Wang, Dalong Zhang

PDF

2 Models

TL;DR

Ling 2.0 is a series of large-scale, sparsely activated language models up to one trillion parameters, designed to enhance reasoning capabilities efficiently through innovative architecture, training, and infrastructure techniques.

Contribution

This work introduces Ling 2.0, a scalable, reasoning-oriented language foundation with novel sparse MoE architecture, training methods, and a new Pareto frontier at trillion scale.

Findings

01

Achieves up to 7-fold efficiency over dense models.

02

Establishes a new Pareto frontier for reasoning accuracy and efficiency.

03

Demonstrates effective reasoning at trillion scale with sparse activation.

Abstract

We introduce Ling 2.0, a series reasoning-oriented language foundation built upon the principle that every activation boosts reasoning capability. Designed to scale from tens of billions to one trillion parameters under a unified Mixture-of-Experts (MoE) paradigm, Ling 2.0 emphasizes high sparsity, cross-scale consistency, and efficiency guided by empirical scaling laws. The series includes three non-thinking (instruct) models - Ling-mini-2.0, Ling-flash-2.0, and Ling-1T - ranging from 16B to 1T total parameters and achieving up to 7-fold active-compute efficiency compared with dense counterparts. Ling 2.0 integrates coordinated innovations across model architecture, pre-training, post-training, and infrastructure: a high-sparsity MoE with MTP for efficient reasoning, reasoning-oriented data and mid-training CoT activation, reinforcement-based fine-tuning (DFT, Evo-CoT), and full-scale…

Peer Reviews

No public reviews on file for this paper yet. If you reviewed it on a platform where reviews are public (OpenReview, ICLR, NeurIPS, ICML), you can paste yours below so the community can read it here.

Code & Models

Models

Videos

No videos yet. Explain this paper in a talk, walkthrough, or lecture? Add one.