NAVER: A Neuro-Symbolic Compositional Automaton for Visual Grounding with Explicit Logic Reasoning

Zhixi Cai; Fucai Ke; Simindokht Jahangard; Maria Garcia de la Banda; Reza Haffari; Peter J. Stuckey; Hamid Rezatofighi

arXiv:2502.00372·cs.CV·August 15, 2025

NAVER: A Neuro-Symbolic Compositional Automaton for Visual Grounding with Explicit Logic Reasoning

Zhixi Cai, Fucai Ke, Simindokht Jahangard, Maria Garcia de la Banda, Reza Haffari, Peter J. Stuckey, Hamid Rezatofighi

PDF

Open Access 1 Repo

TL;DR

NAVER introduces a neuro-symbolic automaton for visual grounding that combines explicit probabilistic logic reasoning with a self-correcting mechanism, achieving state-of-the-art results in complex reasoning tasks.

Contribution

The paper presents NAVER, a novel compositional visual grounding approach integrating explicit logic reasoning within a finite-state automaton, enhancing robustness and interpretability.

Findings

01

NAVER outperforms recent baselines in visual grounding tasks.

02

Explicit logic reasoning improves robustness in complex queries.

03

Self-correcting mechanism enhances inference accuracy.

Abstract

Visual Grounding (VG) tasks, such as referring expression detection and segmentation tasks are important for linking visual entities to context, especially in complex reasoning tasks that require detailed query interpretation. This paper explores VG beyond basic perception, highlighting challenges for methods that require reasoning like human cognition. Recent advances in large language methods (LLMs) and Vision-Language methods (VLMs) have improved abilities for visual comprehension, contextual understanding, and reasoning. These methods are mainly split into end-to-end and compositional methods, with the latter offering more flexibility. Compositional approaches that integrate LLMs and foundation models show promising performance but still struggle with complex reasoning with language-based logical representations. To address these limitations, we propose NAVER, a compositional visual…

Peer Reviews

No public reviews on file for this paper yet. If you reviewed it on a platform where reviews are public (OpenReview, ICLR, NeurIPS, ICML), you can paste yours below so the community can read it here.

Code & Models

Repositories

controlnet/naver
pytorchOfficial

Videos

No videos yet. Explain this paper in a talk, walkthrough, or lecture? Add one.

Taxonomy

TopicsConstraint Satisfaction and Optimization · AI-based Problem Solving and Planning