Co-Evolving LLM Decision and Skill Bank Agents for Long-Horizon Tasks

ArXi:2604.20987v1 Announce Type: new Long horizon interactive environments are a testbed for evaluating agents skill usage abilities. These environments demand multi step reasoning, the chaining of multiple skills over many timesteps, and robust decision making under delayed rewards and partial observability. Games are a good testbed for evaluating agent skill usage in environments.