Robust Multi-Agent Reinforcement Learning by Mutual Information   Regularization

Simin Li; Ruixiao Xu; Jingqiao Xiu; Yuwei Zheng; Pu Feng; Yaodong; Yang; Xianglong Liu

arXiv:2310.09833·cs.LG·May 22, 2024·1 cites

Robust Multi-Agent Reinforcement Learning by Mutual Information Regularization

Simin Li, Ruixiao Xu, Jingqiao Xiu, Yuwei Zheng, Pu Feng, Yaodong, Yang, Xianglong Liu

PDF

Open Access

TL;DR

This paper introduces MIR3, a mutual information regularization approach for robust multi-agent reinforcement learning that improves safety and efficiency without explicit threat scenario enumeration, validated in StarCraft II and robot swarms.

Contribution

It proposes MIR3, a novel regularization technique that implicitly maximizes robustness in MARL through an information bottleneck, avoiding explicit threat modeling.

Findings

01

MIR3 outperforms baseline methods in robustness and efficiency.

02

MIR3 maintains cooperative performance in complex environments.

03

Real-world robot swarm deployment shows 14.29% improvement.

Abstract

In multi-agent reinforcement learning (MARL), ensuring robustness against unpredictable or worst-case actions by allies is crucial for real-world deployment. Existing robust MARL methods either approximate or enumerate all possible threat scenarios against worst-case adversaries, leading to computational intensity and reduced robustness. In contrast, human learning efficiently acquires robust behaviors in daily life without preparing for every possible threat. Inspired by this, we frame robust MARL as an inference problem, with worst-case robustness implicitly optimized under all threat scenarios via off-policy evaluation. Within this framework, we demonstrate that Mutual Information Regularization as Robust Regularization (MIR3) during routine training is guaranteed to maximize a lower bound on robustness, without the need for adversaries. Further insights show that MIR3 acts as an…

Peer Reviews

No public reviews on file for this paper yet. If you reviewed it on a platform where reviews are public (OpenReview, ICLR, NeurIPS, ICML), you can paste yours below so the community can read it here.

Videos

No videos yet. Explain this paper in a talk, walkthrough, or lecture? Add one.

Taxonomy

TopicsAdversarial Robustness in Machine Learning · Reinforcement Learning in Robotics · Explainable Artificial Intelligence (XAI)