La evolución de Kubernetes hacia entornos con miles de nodos ha revelado un cuello de botella clásico en la arquitectura de controladores: el coste de procesar eventos de alto cardinalidad. Cada réplica de un controlador, aunque solo gestione una fracción de los objetos, recibe el flujo completo de eventos del API server, deserializando datos que luego descarta. Con la versión 1.36, el proyecto introduce un mecanismo de fragmentación desde el lado del servidor (server-side sharded list and watch) que permite que cada réplica reciba únicamente el subconjunto de recursos que le corresponde, reduciendo drásticamente el tráfico de red, el consumo de CPU y la memoria necesaria. Este cambio no es solo una mejora de rendimiento; es un replanteamiento de cómo escalar aplicaciones nativas de cloud. En entornos donde las organizaciones despliegan aplicaciones a medida que gestionan millones de objetos, el filtrado temprano en la fuente evita que el coste de escalar horizontalmente se multiplique con cada réplica. En Q2BSTUDIO, empresa especializada en desarrollo de software y tecnología, entendemos que las arquitecturas eficientes son la base para que las empresas puedan integrar componentes como ia para empresas y servicios inteligencia de negocio sin sobrecargar la infraestructura. La fragmentación servidora, al operar sobre hashes deterministas del UID o del namespace, permite que cada controlador reciba solo los eventos relevantes, lo que resulta clave cuando se combinan con sistemas de agentes IA que necesitan reaccionar en tiempo real a cambios en el clúster. Además, este enfoque se integra de forma natural con servicios cloud aws y azure, ya que reduce el ancho de banda y la facturación de transferencias de datos. La implementación práctica exige que los controladores utilicen informers con la opción WithTweakListOptions para inyectar el selector de rango, y que verifiquen la presencia del campo shardInfo en la respuesta para confirmar que el servidor ha aplicado el filtro. Si el servidor no soporta la característica (por ejemplo, por tener desactivado el feature gate), el cliente debe aplicar un filtrado local como caída de seguridad, lo que obliga a incluir lógica de tolerancia en el software a medida de cada organización. Para Q2BSTUDIO, este tipo de optimización es fundamental en proyectos que despliegan plataformas de observabilidad, ciberseguridad basada en eventos de clúster, o sistemas de power bi que extraen métricas de Kubernetes. La capacidad de escalar sin multiplicar la carga es un habilitador para que equipos de infraestructura y desarrollo puedan centrarse en la lógica de negocio en lugar de pagar constantemente por datos que no necesitan. Este avance, aún en alpha, promete transformar la manera en que se diseñan controladores para clústeres masivos, y desde Q2BSTUDIO seguimos de cerca su evolución para incorporarlo en nuestras arquitecturas de aplicaciones empresariales.