IRDS: Selección de datos RLVR interpretable mediante cobertura de autoencoder disperso acoplado a verificador
IRDS selección interpretable de datos RLVR con autoencoder disperso y verificador. Optimiza el aprendizaje por refuerzo con transparencia y eficiencia.