Harm or Humor: A Multimodal, Multilingual Benchmark for Overt and Covert Harmful Humor

ArXi:2603.17759v2 Announce Type: replace-cross Dark humor often relies on subtle cultural nuances and implicit cues that require contextual reasoning to interpret, posing safety challenges that current static benchmarks fail to capture. To address this, we