Más allá del token muestreado: preservando el soporte de candidatos en RLVR Descubre cómo CaSP preserva la distribución de candidatos en RLVR, evitando el colapso de exploración y mejorando el rendimiento. 2026-06-17 · 2 min