Grasp-Then-Plan con Atribución de Fallos: Manipulación Robótica Precisa
Descubre cómo GTP-FA mejora la manipulación robótica con un marco de dos etapas que diagnostica y corrige fallos de agarre y planificación en tareas complejas.
Descubre cómo GTP-FA mejora la manipulación robótica con un marco de dos etapas que diagnostica y corrige fallos de agarre y planificación en tareas complejas.
Descubre PHASER, un marco de aprendizaje continuo para modelos VLA que evita el olvido catastrófico. Asigna memoria por fases y prioriza tareas olvidadas, logra
Un estudio revela que el entrenamiento por consistencia puede afianzar la desalineación en modelos de IA. Descubre sus efectos contradictorios en la alineación.
Analizamos las perspectivas éticas sobre humanizar chatbots con IA: riesgos de dependencia, engaño y oportunidades para inclusión y bienestar.
Aprende cómo la técnica de modelos mundiales acoplados permite entrenar RL de forma eficiente sin simuladores, usando difusión y gradientes de primer orden para tareas de manipulación.
¿Pueden los robots ocultar fallos? Un estudio revela que los falsos éxitos en manipulación son más detectables de lo que parece, pero el ruido los enmascara. Descubre cómo.
Descubre cómo clasificar y predecir fallos en RLHF como reward hacking y colapso. Estudio empírico con PPO y DPO que revela dinámicas ocultas.
Aprende cómo MVL usa suavizado espacial para estimación de valor estable en RL offline, mejorando navegación y manipulación robótica.
Descubre cómo el aprendizaje por refuerzo con información física (Pi-GCRL) maneja dinámicas de contacto híbridas en manipulación robótica. ¡Entra!
Descubre RoboBenchMart, un benchmark open-source para robots en entornos minoristas. Evalúa modelos VLA en tareas complejas con objetos del supermercado. ¿Están listos los robots para el retail?
Lie Diffuser Actor corrige la falacia euclidiana en políticas VLA usando difusión en el espacio tangente de SE(3). Mejora un 7.3% en CALVIN ABC→D.
MRO-GWM: modelo de mundo con Gaussian Splatting que predice movimientos rígidos condicionales a acciones. Ideal para robótica y control predictivo.
Descubre GIFT: robots transfieren habilidades de manipulación desde una sola demostración humana usando geometría y mapas funcionales.
SpeedAug acelera políticas robóticas con RL: aumenta 1.8x el rendimiento en solo 16 minutos de interacción sin comprometer la tasa de éxito.
Descubre cómo se detectaron 157 habilidades maliciosas en agentes de IA, incluyendo robo de credenciales y manipulación. ¡Protege tu código!
Descubre cómo la conciencia parcial de equidad resuelve el dilema entre transparencia y manipulación, mejorando la justicia en modelos de IA con un mecanismo guiado por creencias.
LP-DS optimiza políticas generativas congeladas mediante perturbaciones en el espacio de ruido, logrando hasta un 25% más de retorno en robótica y locomoción.
Descubre cómo HOIST combina imitación y RL para que humanoides manipulen cargas suspendidas con alta precisión. Reduce errores de colocación en 19.9 cm.
Descubre por qué el error por grupo predice mejor el rendimiento real que el MSE total en el ajuste fino de modelos VLA para robots manipuladores móviles de 11 GDL.
Descubre RDA, un agente basado en VLM que diseña recompensas semánticas para robots. Logra políticas alineadas con instrucciones humanas en manipulación.