Ponderación Jerárquica de Ventajas para Aprendizaje por Refuerzo Online de VLAs
Descubre HABC: mejora el fine-tuning de políticas VLA con recompensas binarias, alcanzando hasta un 92% de éxito en manipulación bimanual.
Descubre HABC: mejora el fine-tuning de políticas VLA con recompensas binarias, alcanzando hasta un 92% de éxito en manipulación bimanual.
Descubre SPARC: compresión de imágenes que asigna bitrate según relevancia, mejorando el control robótico con modelos VLA.
TempoVLA controla la velocidad de robots manipuladores: acelera en zonas seguras y desacelera en contacto. Aumenta eficiencia y seguridad.