UniComp: A Unified Evaluation of Large Language Model Compression via Pruning, Quantization and Distillation

ArXi:2602.09130v3 Announce Type: replace Model compression is increasingly essential for deploying large language models (LLMs), yet existing comparative studies largely focus on pruning and quantization evaluated primarily on knowledge-centric benchmarks. Thus, we