AI RESEARCH

Structured Visual Narratives Undermine Safety Alignment in Multimodal Large Language Models

arXiv CS.AI • March 24, 2026

ArXi:2603.21697v1 Announce Type: cross Multimodal Large Language Models (MLLMs) extend text-only LLMs with visual reasoning, but also