Enrutamiento consciente de costos en RAG: Compensaciones de profundidad CA-RAG optimiza el enrutamiento en RAG: reduce tokens 26% y latencia 34%. 2026-06-03 · 3 min