AI RESEARCH

Can Compact Language Models Search Like Agents? Distillation-Guided Policy Optimization for Preserving Agentic RAG Capabilities

arXiv CS.CL • April 28, 2026

ArXi:2508.20324v4 Announce Type: replace Reinforcement Learning has emerged as a dominant post-