DeepSeek-V3.2: Pushing the Frontier of Open Large Language Models

DeepSeek-AI; Aixin Liu; Aoxue Mei; Bangcai Lin; Bing Xue; Bingxuan Wang; Bingzheng Xu; Bochao Wu; Bowei Zhang; Chaofan Lin; Chen Dong; Chengda Lu; Chenggang Zhao; Chengqi Deng; Chenhao Xu; Chong Ruan; Damai Dai; Daya Guo; Dejian Yang; Deli Chen; Erhang Li; Fangqi Zhou; Fangyun Lin; Fucong Dai; Guangbo Hao; Guanting Chen; Guowei Li; H. Zhang; Hanwei Xu; Hao Li; Haofen Liang; Haoran Wei; Haowei Zhang; Haowen Luo; Haozhe Ji; Honghui Ding; Hongxuan Tang; Huanqi Cao; Huazuo Gao; Hui Qu; Hui Zeng; Jialiang Huang; Jiashi Li; Jiaxin Xu; Jiewen Hu; Jingchang Chen; Jingting Xiang; Jingyang Yuan; Jingyuan Cheng; Jinhua Zhu; Jun Ran; Junguang Jiang; Junjie Qiu; Junlong Li; Junxiao Song; Kai Dong; Kaige Gao; Kang Guan; Kexin Huang; Kexing Zhou; Kezhao Huang; Kuai Yu; Lean Wang; Lecong Zhang; Lei Wang; Liang Zhao; Liangsheng Yin; Lihua Guo; Lingxiao Luo; Linwang Ma; Litong Wang; Liyue Zhang; M.S. Di; M.Y Xu; Mingchuan Zhang; Minghua Zhang; Minghui Tang; Mingxu Zhou; Panpan Huang; Peixin Cong; Peiyi Wang; Qiancheng Wang; Qihao Zhu; Qingyang Li; Qinyu Chen; Qiushi Du; Ruiling Xu; Ruiqi Ge; Ruisong Zhang; Ruizhe Pan; Runji Wang; Runqiu Yin; Runxin Xu; Ruomeng Shen; Ruoyu Zhang; S.H. Liu; Shanghao Lu; Shangyan Zhou; Shanhuang Chen; Shaofei Cai; Shaoyuan Chen; Shengding Hu; Shengyu Liu; Shiqiang Hu; Shirong Ma; Shiyu Wang; Shuiping Yu; Shunfeng Zhou; Shuting Pan; Songyang Zhou; Tao Ni; Tao Yun; Tian Pei; Tian Ye; Tianyuan Yue; Wangding Zeng; Wen Liu; Wenfeng Liang; Wenjie Pang; Wenjing Luo; Wenjun Gao; Wentao Zhang; Xi Gao; Xiangwen Wang; Xiao Bi; Xiaodong Liu; Xiaohan Wang; Xiaokang Chen; Xiaokang Zhang; Xiaotao Nie; Xin Cheng; Xin Liu; Xin Xie; Xingchao Liu; Xingkai Yu; Xingyou Li; Xinyu Yang; Xinyuan Li; Xu Chen; Xuecheng Su; Xuehai Pan; Xuheng Lin; Xuwei Fu; Y.Q. Wang; Yang Zhang; Yanhong Xu; Yanru Ma; Yao Li; Yao Li; Yao Zhao; Yaofeng Sun; Yaohui Wang; Yi Qian; Yi Yu; Yichao Zhang; Yifan Ding; Yifan Shi; Yiliang Xiong; Ying He; Ying Zhou; Yinmin Zhong; Yishi Piao; Yisong Wang; Yixiao Chen; Yixuan Tan; Yixuan Wei; Yiyang Ma; Yiyuan Liu; Yonglun Yang; Yongqiang Guo; Yongtong Wu; Yu Wu; Yuan Cheng; Yuan Ou; Yuanfan Xu; Yuduan Wang; Yue Gong; Yuhan Wu; Yuheng Zou; Yukun Li; Yunfan Xiong; Yuxiang Luo; Yuxiang You; Yuxuan Liu; Yuyang Zhou; Z.F. Wu; Z.Z. Ren; Zehua Zhao; Zehui Ren; Zhangli Sha; Zhe Fu; Zhean Xu; Zhenda Xie; Zhengyan Zhang; Zhewen Hao; Zhibin Gou; Zhicheng Ma; Zhigang Yan; Zhihong Shao; Zhixian Huang; Zhiyu Wu; Zhuoshu Li; Zhuping Zhang; Zian Xu; Zihao Wang; Zihui Gu; Zijia Zhu; Zilin Li; Zipeng Zhang; Ziwei Xie; Ziyi Gao; Zizheng Pan; Zongqing Yao; Bei Feng; Hui Li; J.L. Cai; Jiaqi Ni; Lei Xu; Meng Li; Ning Tian; R.J. Chen; R.L. Jin; S.S. Li; Shuang Zhou; Tianyu Sun; X.Q. Li; Xiangyue Jin; Xiaojin Shen; Xiaosha Chen; Xinnan Song; Xinyi Zhou; Y.X. Zhu; Yanping Huang; Yaohui Li; Yi Zheng; Yuchen Zhu; Yunxian Ma; Zhen Huang; Zhipeng Xu; Zhongyu Zhang; Dongjie Ji; Jian Liang; Jianzhong Guo; Jin Chen; Leyi Xia; Miaojun Wang; Mingming Li; Peng Zhang; Ruyi Chen; Shangmian Sun; Shaoqing Wu; Shengfeng Ye; T.Wang; W.L. Xiao; Wei An; Xianzu Wang; Xiaowen Sun; Xiaoxiang Wang; Ying Tang; Yukun Zha; Zekai Zhang; Zhe Ju; Zhen Zhang; Zihua Qu

arXiv:2512.02556·cs.CL·December 3, 2025·2 cites

DeepSeek-V3.2: Pushing the Frontier of Open Large Language Models

DeepSeek-AI, Aixin Liu, Aoxue Mei, Bangcai Lin, Bing Xue, Bingxuan Wang, Bingzheng Xu, Bochao Wu, Bowei Zhang, Chaofan Lin, Chen Dong, Chengda Lu, Chenggang Zhao, Chengqi Deng, Chenhao Xu, Chong Ruan, Damai Dai, Daya Guo, Dejian Yang, Deli Chen, Erhang Li, Fangqi Zhou

PDF

Open Access 1 Models

TL;DR

DeepSeek-V3.2 advances open large language models by introducing efficient attention, scalable reinforcement learning, and a large-scale data synthesis pipeline, achieving state-of-the-art reasoning and agent performance.

Contribution

It presents novel attention mechanisms, a scalable reinforcement learning framework, and a large-scale data synthesis pipeline, significantly improving efficiency and reasoning in large language models.

Findings

01

Surpasses GPT-5 in performance

02

Achieves IMO and IOI gold medals

03

Enhances reasoning and instruction-following robustness

Abstract

We introduce DeepSeek-V3.2, a model that harmonizes high computational efficiency with superior reasoning and agent performance. The key technical breakthroughs of DeepSeek-V3.2 are as follows: (1) DeepSeek Sparse Attention (DSA): We introduce DSA, an efficient attention mechanism that substantially reduces computational complexity while preserving model performance in long-context scenarios. (2) Scalable Reinforcement Learning Framework: By implementing a robust reinforcement learning protocol and scaling post-training compute, DeepSeek-V3.2 performs comparably to GPT-5. Notably, our high-compute variant, DeepSeek-V3.2-Speciale, surpasses GPT-5 and exhibits reasoning proficiency on par with Gemini-3.0-Pro, achieving gold-medal performance in both the 2025 International Mathematical Olympiad (IMO) and the International Olympiad in Informatics (IOI). (3) Large-Scale Agentic Task…

Peer Reviews

No public reviews on file for this paper yet. If you reviewed it on a platform where reviews are public (OpenReview, ICLR, NeurIPS, ICML), you can paste yours below so the community can read it here.

Code & Models

Models

🤗
matrixx17/llama3.2-1b-dsa
model· 38 dl
38 dl

Videos

No videos yet. Explain this paper in a talk, walkthrough, or lecture? Add one.

Taxonomy

TopicsTopic Modeling · Machine Learning in Materials Science · Artificial Intelligence in Healthcare and Education