vla.cpp: Runtime de inferencia unificado para modelos VLA vla.cpp ejecuta modelos VLA en 1.3 GB, igualando rendimiento Python en GPU. Optimiza inferencia en hardware robótico. 2026-06-09 · 3 min