Distribution Matching Distillation Meets Reinforcement Learning

ArXi:2511.13649v4 Announce Type: replace Distribution Matching Distillation (DMD) facilitates efficient inference by distilling multi-step diffusion models into few-step variants. Concurrently, Reinforcement Learning (RL) has emerged as a vital tool for aligning generative models with human preferences. While both represent critical post-