AI RESEARCH

RIFT: A RubrIc Failure Mode Taxonomy and Automated Diagnostics

arXiv CS.AI • April 22, 2026

ArXi:2604.01375v2 Announce Type: replace Rubric-based evaluation is widely used in LLM benchmarks and