Corrección Especulativa con Rollback para Imitación de Agentes Web Diversos
Descubre cómo SRC mejora el entrenamiento de agentes web por imitación, reduciendo errores y aumentando diversidad. Resultados en WebArena-Infinity.
Descubre cómo SRC mejora el entrenamiento de agentes web por imitación, reduciendo errores y aumentando diversidad. Resultados en WebArena-Infinity.
Descubre cómo RGFiLM reduce las falsas alarmas en la detección de anomalías marítimas al ajustar el condicionamiento según la rareza del contexto.
Descubre MiDiGap, un método de aprendizaje robótico que aprende políticas complejas con solo 5 demostraciones en menos de un minuto. ¡Resultados líderes en manipulación!
MiDiGap aprende políticas robóticas desde solo 5 demostraciones con cámara. Logra evitar obstáculos, transferir entre robots y mejorar éxito un 76% en RLBench.
Descubre NGT, método ligero que aprende por imitación con solo 20 transiciones y sin pretraining. Perfecto para tareas complejas como humanoides.
Descubre cómo las Fourier Features mejoran la precisión en aprendizaje por imitación para robótica. Resultados en benchmarks y robots reales. ¡Lee más!
DuoBench: benchmark reproducible para manipulación bimanual. Evalúa políticas de aprendizaje y visión-lenguaje-acción en simulación y realidad. Incluye datasets y análisis de fallos.
Descubre cómo Ambient Diffusion Policy aprende de datos subóptimos en robótica. Mejora el rendimiento hasta un 33% usando solo características útiles de demostraciones de baja calidad.
Descubre cómo NEXT estima torque externo sin sensores y FIRST mejora el aprendizaje robótico un 17%. Teleoperación sin hardware extra.
Descubre cómo aprender manipulación robótica diestra desde videos humanos, logrando 75% de éxito sin demostraciones robóticas. Innovación en IA.
CLASP permite a robots entender comandos en lenguaje natural y aprender habilidades con solo 2-5 demostraciones, logrando un 73-100% de éxito.
Evaluamos modelos VLA en robots de bajo costo con el benchmark SO-101: fallos, recuperación y robustez. ¡Descubre los resultados!
RL4F: el benchmark de aprendizaje por refuerzo offline para control de plasma en fusión nuclear. Evaluamos métodos de RL e imitación en tareas de perfil completo con datos reales del tokamak DIII-D.
El clonado conductual optimiza la anotación de datos, reduce errores y acelera procesos. Estudio revela habilidades emergentes y representaciones internas.
AxisGuide mejora la manipulación robótica al visualizar coordenadas de acción en imágenes RGB. Aumenta el rendimiento y la generalización en tareas de recogida.
Las métricas de curación solo-acción fallan ante defectos estructurales en demostraciones. Incluso las mejores solo recuperan un tercio del rendimiento.
Las métricas de solo acciones no detectan defectos estructurales clave en demonstraciones. Un estudio revela que solo métricas de trayectoria de estado mejoran
LadderMan: robots humanoides escalan escaleras y manipulan objetos. Sistema híbrido de aprendizaje y visión por IA. Transferencia sim-to-real sin ajustes.
El condicionamiento del éxito optimiza políticas imitando aciertos. Aprende la teoría y su aplicación en IA.
Descubre Instant-Fold: robots manipulan objetos deformables con una sola demostración humana, sin necesidad de entrenamiento adicional. Aprende cómo.