MuPHI: Aprendizaje de razonamiento implícito de daño multimodal a través de optimización de recompensa fundamentada semánticamente MuPHI: Razonamiento implícito de daño multimodal con optimización semántica. 2026-05-30 · 2 min