#aprendizaje por imitación

Corrección Especulativa con Rollback para Imitación de Agentes Web Diversos

Descubre cómo SRC mejora el entrenamiento de agentes web por imitación, reduciendo errores y aumentando diversidad. Resultados en WebArena-Infinity.

2026-06-12 · 2 min

Condicionamiento de contexto basado en rareza para detección de anomalías marítimas

Descubre cómo RGFiLM reduce las falsas alarmas en la detección de anomalías marítimas al ajustar el condicionamiento según la rareza del contexto.

2026-06-12 · 2 min

MiDiGap: aprendizaje robótico eficaz con procesos gaussianos

Descubre MiDiGap, un método de aprendizaje robótico que aprende políticas complejas con solo 5 demostraciones en menos de un minuto. ¡Resultados líderes en manipulación!

2026-06-11 · 1 min

MiDiGap: La asombrosa eficacia de los procesos gaussianos discretos

MiDiGap aprende políticas robóticas desde solo 5 demostraciones con cámara. Logra evitar obstáculos, transferir entre robots y mejorar éxito un 76% en RLBench.

2026-06-11 · 2 min

Transporte guiado por ruido para aprendizaje por imitación

Descubre NGT, método ligero que aprende por imitación con solo 20 transiciones y sin pretraining. Perfecto para tareas complejas como humanoides.

2026-06-11 · 2 min

Fourier Features para aprendizaje por imitación de alta precisión

Descubre cómo las Fourier Features mejoran la precisión en aprendizaje por imitación para robótica. Resultados en benchmarks y robots reales. ¡Lee más!

2026-06-11 · 3 min

DuoBench: Benchmark para manipulación bimanual en simulación y mundo real

DuoBench: benchmark reproducible para manipulación bimanual. Evalúa políticas de aprendizaje y visión-lenguaje-acción en simulación y realidad. Incluye datasets y análisis de fallos.

2026-06-11 · 1 min

Política de Difusión Ambiental: Aprendizaje por Imitación con Datos Subóptimos

Descubre cómo Ambient Diffusion Policy aprende de datos subóptimos en robótica. Mejora el rendimiento hasta un 33% usando solo características útiles de demostraciones de baja calidad.

2026-06-11 · 2 min

FACTR 2: Detección de fuerza externa mejora aprendizaje en brazos robóticos

Descubre cómo NEXT estima torque externo sin sensores y FIRST mejora el aprendizaje robótico un 17%. Teleoperación sin hardware extra.

2026-06-11 · 2 min

Aprendizaje de Manipulación Robótica desde Demostraciones Humanas

Descubre cómo aprender manipulación robótica diestra desde videos humanos, logrando 75% de éxito sin demostraciones robóticas. Innovación en IA.

2026-06-10 · 2 min

CLASP: Selección y composición de habilidades robóticas con lenguaje natural

CLASP permite a robots entender comandos en lenguaje natural y aprender habilidades con solo 2-5 demostraciones, logrando un 73-100% de éxito.

2026-06-09 · 2 min

Evaluación de modelos VLA en SO-101: Fallos y recuperación

Evaluamos modelos VLA en robots de bajo costo con el benchmark SO-101: fallos, recuperación y robustez. ¡Descubre los resultados!

2026-06-09 · 2 min

RL Offline para Control de Plasma en Fusión Nuclear: Benchmark y Código Abierto

RL4F: el benchmark de aprendizaje por refuerzo offline para control de plasma en fusión nuclear. Evaluamos métodos de RL e imitación en tareas de perfil completo con datos reales del tokamak DIII-D.

2026-06-09 · 2 min

Clonado conductual en anotación científica: un estudio sistemático

El clonado conductual optimiza la anotación de datos, reduce errores y acelera procesos. Estudio revela habilidades emergentes y representaciones internas.

2026-06-09 · 3 min

AxisGuide: Coordenadas de acción en imágenes RGB para robots

AxisGuide mejora la manipulación robótica al visualizar coordenadas de acción en imágenes RGB. Aumenta el rendimiento y la generalización en tareas de recogida.

2026-06-08 · 2 min

Métricas de curación fallan en defectos estructurales de políticas de imitación

Las métricas de curación solo-acción fallan ante defectos estructurales en demostraciones. Incluso las mejores solo recuperan un tercio del rendimiento.

2026-06-05 · 3 min

Auditoría de métricas de curación: las de solo acciones fallan en defectos estructurales

Las métricas de solo acciones no detectan defectos estructurales clave en demonstraciones. Un estudio revela que solo métricas de trayectoria de estado mejoran

2026-06-05 · 2 min

LadderMan: Escalada de robots humanoides con percepción

LadderMan: robots humanoides escalan escaleras y manipulan objetos. Sistema híbrido de aprendizaje y visión por IA. Transferencia sim-to-real sin ajustes.

2026-06-05 · 3 min