#visión lenguaje acción

AVA-VLA: Mejorando modelos Visión-Lenguaje-Acción con Atención Visual Activa

Descubre cómo AVA-VLA mejora los modelos Visión-Lenguaje-Acción con atención visual activa y estado recurrente, logrando rendimiento de vanguardia en robótica.

2026-06-16 · 2 min

SCALE: Autoajuste de Percepción y Acción con Incertidumbre

SCALE mejora modelos VLA sin entrenamiento extra: modula percepción y acción según incertidumbre en una sola pasada.

2026-06-12 · 3 min

Aprendiendo qué decir a tu VLA: conducción inofensiva

Aprende a dirigir modelos VLA con secuencias de lenguaje óptimas. Marco conformalizado mejora rendimiento robot hasta 65% garantizando intervenciones seguras.

2026-06-11 · 2 min

vla.cpp: Runtime de inferencia unificado para modelos VLA

vla.cpp ejecuta modelos VLA en 1.3 GB, igualando rendimiento Python en GPU. Optimiza inferencia en hardware robótico.

2026-06-09 · 3 min