Semantic-guided Diverse Decoding for Large Language Model

Weijie Shi; Yue Cui; Yaguang Wu; Jingzhi Fang; Shibo Zhang; Mengze Li; Sirui Han; Jia Zhu; Jiajie Xu; Xiaofang Zhou

arXiv:2506.23601·cs.CL·September 30, 2025

Semantic-guided Diverse Decoding for Large Language Model

Weijie Shi, Yue Cui, Yaguang Wu, Jingzhi Fang, Shibo Zhang, Mengze Li, Sirui Han, Jia Zhu, Jiajie Xu, Xiaofang Zhou

PDF

TL;DR

SemDiD is a novel decoding method for large language models that enhances semantic diversity in generated responses by operating in embedding space, leading to better task coverage and training efficiency.

Contribution

Introduces SemDiD, a semantic-guided decoding approach that balances diversity and quality through embedding space guidance and optimization techniques.

Findings

01

Improves Best-of-N coverage by 1.4-5.2% across tasks.

02

Accelerates RLHF training convergence by 15%.

03

Increases accuracy by up to 2.1%.

Abstract

Diverse decoding of large language models is crucial for applications requiring multiple semantically distinct responses, yet existing methods primarily achieve lexical rather than semantic diversity. This limitation significantly constrains Best-of-N strategies, group-based reinforcement learning, and data synthesis. While temperature sampling and diverse beam search modify token distributions or apply n-gram penalties, they fail to ensure meaningful semantic differentiation. We introduce Semantic-guided Diverse Decoding (SemDiD), operating directly in embedding space that balances quality with diversity through three complementary mechanisms: orthogonal directional guidance, dynamic inter-group repulsion, and position-debiased probability assessment. SemDiD harmonizes these competing objectives using adaptive gain functions and constraint optimization, ensuring both quality thresholds…

Peer Reviews

No public reviews on file for this paper yet. If you reviewed it on a platform where reviews are public (OpenReview, ICLR, NeurIPS, ICML), you can paste yours below so the community can read it here.

Videos

No videos yet. Explain this paper in a talk, walkthrough, or lecture? Add one.