Los modelos basados en Mixture-of-Experts (MoE) han ganado protagonismo en inteligencia artificial por su capacidad de escalar cómputo de forma eficiente, pero su despliegue real sigue enfrentando desafíos significativos: el elevado consumo de memoria y la latencia en inferencia limitan su adopción en entornos productivos. Hasta ahora, las estrategias de compresión se centraban en eliminar expertos completos o asignar presupuestos de poda mediante puntuaciones de importancia muy gruesas, lo que perdía la oportunidad de eliminar redundancias más sutiles. Una nueva perspectiva, la poda estructural guiada por atribución y cobertura máxima, aborda este problema analizando la concentración de información dentro de los canales de cada experto, no solo a nivel de bloque. Así se logra reducir hasta un 50% o 25% de la estructura sin sacrificar precisión, combinando la poda con cuantización de 4 bits. Este enfoque permite que modelos como DeepSeek o Qwen mantengan su rendimiento mientras reducen su huella de memoria en más de cinco veces. En la práctica, implementar estas optimizaciones requiere un profundo conocimiento de la arquitectura del modelo y de las técnicas de compresión, algo que impulsa la creación de ia para empresas más ágiles y rentables. En Q2BSTUDIO trabajamos en el desarrollo de aplicaciones a medida y software a medida que integran modelos de IA optimizados, y ofrecemos servicios cloud AWS y Azure para desplegar estos sistemas con altos estándares de rendimiento. Además, combinamos estas capacidades con servicios de inteligencia de negocio con Power BI para que las predicciones de los modelos se traduzcan en dashboards accionables, y con agentes IA que automatizan procesos críticos. La ciberseguridad también se beneficia de modelos más ligeros, ya que permiten auditorías en tiempo real sin sobrecargar los recursos. En definitiva, la poda estructural basada en atribución no solo es una innovación técnica, sino una puerta a implementaciones de inteligencia artificial más sostenibles y escalables para cualquier organización.