Fine-Mem: Fine-Grained Feedback Alignment for Long-Horizon Memory Management

Weitao Ma; Xiaocheng Feng; Lei Huang; Xiachong Feng; Zhanyu Ma; Jun Xu; Jiuchong Gao; Jinghua Hao; Renqing He; Bing Qin

arXiv:2601.08435·cs.CL·January 14, 2026

Fine-Mem: Fine-Grained Feedback Alignment for Long-Horizon Memory Management

Weitao Ma, Xiaocheng Feng, Lei Huang, Xiachong Feng, Zhanyu Ma, Jun Xu, Jiuchong Gao, Jinghua Hao, Renqing He, Bing Qin

PDF

Open Access

TL;DR

Fine-Mem introduces a novel fine-grained feedback mechanism for memory management in large language models, improving credit assignment and task performance in long-horizon tasks.

Contribution

It proposes a unified framework with chunk-level rewards and evidence-anchored reward attribution to enhance memory operation guidance.

Findings

01

Outperforms strong baselines on Memalpha and MemoryAgentBench.

02

Achieves higher success rates across various sub-tasks.

03

Demonstrates strong generalization across models and backbones.

Abstract

Effective memory management is essential for large language model agents to navigate long-horizon tasks. Recent research has explored using Reinforcement Learning to develop specialized memory manager agents. However, existing approaches rely on final task performance as the primary reward, which results in severe reward sparsity and ineffective credit assignment, providing insufficient guidance for individual memory operations. To this end, we propose Fine-Mem, a unified framework designed for fine-grained feedback alignment. First, we introduce a Chunk-level Step Reward to provide immediate step-level supervision via auxiliary chunk-specific question answering tasks. Second, we devise Evidence-Anchored Reward Attribution to redistribute global rewards by anchoring credit to key memory operations, based on the specific memory items utilized as evidence in reasoning. Together, these…

Peer Reviews

No public reviews on file for this paper yet. If you reviewed it on a platform where reviews are public (OpenReview, ICLR, NeurIPS, ICML), you can paste yours below so the community can read it here.

Videos

No videos yet. Explain this paper in a talk, walkthrough, or lecture? Add one.

Taxonomy

TopicsTopic Modeling · Multimodal Machine Learning Applications · Reinforcement Learning in Robotics