En el ámbito del aprendizaje automático, el entrenamiento de modelos con conjuntos de datos masivos plantea desafíos significativos en términos de tiempo y recursos computacionales. Para abordar esta problemática, han surgido técnicas de poda dinámica de datos que seleccionan subconjuntos representativos durante el entrenamiento, reduciendo costes sin perder información crítica. Sin embargo, muchos métodos actuales fracasan en mantener una precisión sólida en los peores grupos (worst-group accuracy) cuando las tasas de poda son altas, especialmente en conjuntos de datos desbalanceados. En este contexto, el algoritmo RCAP (Robust, Class-Aware, Probabilistic Dynamic Dataset Pruning) propone una solución elegante: estimar mediante una fórmula cerrada la fracción óptima de muestras a retener por cada clase, ajustándola dinámicamente en cada época según la pérdida agregada de dicha clase. Luego, aplica un muestreo adaptativo que prioriza las muestras con mayor pérdida, garantizando que las clases minoritarias no sean infrarepresentadas. Los resultados experimentales, realizados sobre seis conjuntos de datos y cinco modelos distintos, muestran que RCAP supera a los métodos de poda de última generación, logrando incluso una mejora superior al 1 % en precisión usando solo el 10 % de los datos en conjuntos desbalanceados, con un aceleramiento medio de 8.69 veces. Este avance tiene implicaciones directas para la industria: permite entrenar modelos de inteligencia artificial para empresas de forma más eficiente, reduciendo costes y tiempos de iteración. En Q2BSTUDIO, como empresa de desarrollo de software y tecnología, integramos estas innovaciones en aplicaciones a medida que optimizan procesos de aprendizaje automático. Nuestra oferta abarca desde software a medida hasta soluciones de ciberseguridad y servicios cloud AWS y Azure, pasando por servicios de inteligencia de negocio con Power BI. Además, desarrollamos agentes IA que aplican técnicas como RCAP para mejorar la eficiencia de modelos en producción. La combinación de poda inteligente y una infraestructura cloud robusta permite a las organizaciones escalar sus capacidades analíticas sin incurrir en gastos desmedidos. En definitiva, algoritmos como RCAP representan un paso firme hacia un entrenamiento de modelos más sostenible y accesible, y en Q2BSTUDIO estamos preparados para ayudar a las empresas a implementarlos dentro de sus ecosistemas tecnológicos.