#manipulación

Grasp-Then-Plan con Atribución de Fallos: Manipulación Robótica Precisa

Descubre cómo GTP-FA mejora la manipulación robótica con un marco de dos etapas que diagnostica y corrige fallos de agarre y planificación en tareas complejas.

2026-06-03 · 2 min

PHASER: Aprendizaje continuo con repetición de experiencia por fases para modelos VLA

Descubre PHASER, un marco de aprendizaje continuo para modelos VLA que evita el olvido catastrófico. Asigna memoria por fases y prioriza tareas olvidadas, logra

2026-06-03 · 2 min

El entrenamiento de consistencia puede afianzar la desalineación

Un estudio revela que el entrenamiento por consistencia puede afianzar la desalineación en modelos de IA. Descubre sus efectos contradictorios en la alineación.

2026-06-03 · 2 min

Perspectivas éticas al humanizar chatbots con inteligencia artificial

Analizamos las perspectivas éticas sobre humanizar chatbots con IA: riesgos de dependencia, engaño y oportunidades para inclusión y bienestar.

2026-06-03 · 2 min

Modelos Locales y Globales para RL Eficiente de Primer Orden

Aprende cómo la técnica de modelos mundiales acoplados permite entrenar RL de forma eficiente sin simuladores, usando difusión y gradientes de primer orden para tareas de manipulación.

2026-06-03 · 2 min

Visibilidad de falsos éxitos en manipulación robótica

¿Pueden los robots ocultar fallos? Un estudio revela que los falsos éxitos en manipulación son más detectables de lo que parece, pero el ruido los enmascara. Descubre cómo.

2026-06-03 · 3 min

Cuando RLHF falla: taxonomía de reward hacking, colapso y manipulación

Descubre cómo clasificar y predecir fallos en RLHF como reward hacking y colapso. Estudio empírico con PPO y DPO que revela dinámicas ocultas.

2026-06-03 · 2 min

Aprendizaje de Valor Suavizado en Aprendizaje por Refuerzo

Aprende cómo MVL usa suavizado espacial para estimación de valor estable en RL offline, mejorando navegación y manipulación robótica.

2026-06-03 · 2 min

Aprendizaje por Refuerzo con Información Física en Contactos Híbridos

Descubre cómo el aprendizaje por refuerzo con información física (Pi-GCRL) maneja dinámicas de contacto híbridas en manipulación robótica. ¡Entra!

2026-06-03 · 1 min

RoboBenchMart: Evaluación de robots en entornos minoristas

Descubre RoboBenchMart, un benchmark open-source para robots en entornos minoristas. Evalúa modelos VLA en tareas complejas con objetos del supermercado. ¿Están listos los robots para el retail?

2026-06-02 · 1 min

Corrigiendo la Falacia Euclidiana en Políticas VLA con Lie Diffuser Actor

Lie Diffuser Actor corrige la falacia euclidiana en políticas VLA usando difusión en el espacio tangente de SE(3). Mejora un 7.3% en CALVIN ABC→D.

2026-06-02 · 1 min

Modelos de mundo para objetos rígidos con Gaussian Splatting y acciones

MRO-GWM: modelo de mundo con Gaussian Splatting que predice movimientos rígidos condicionales a acciones. Ideal para robótica y control predictivo.

2026-06-02 · 2 min

GIFT: Transferencia funcional inducida por geometría para manipulación de objetos

Descubre GIFT: robots transfieren habilidades de manipulación desde una sola demostración humana usando geometría y mapas funcionales.

2026-06-02 · 2 min

SpeedAug: Aceleración de Políticas con Tempo y RL

SpeedAug acelera políticas robóticas con RL: aumenta 1.8x el rendimiento en solo 16 minutos de interacción sin comprometer la tasa de éxito.

2026-06-02 · 2 min

No menciones esto al usuario: Detectando habilidades maliciosas en agentes

Descubre cómo se detectaron 157 habilidades maliciosas en agentes de IA, incluyendo robo de credenciales y manipulación. ¡Protege tu código!

2026-06-02 · 1 min

Conciencia Parcial de Equidad en Aprendizaje Automático Estratégico

Descubre cómo la conciencia parcial de equidad resuelve el dilema entre transparencia y manipulación, mejorando la justicia en modelos de IA con un mecanismo guiado por creencias.

2026-06-02 · 2 min

LP-DS: Dirección de difusión con perturbación lagrangiana

LP-DS optimiza políticas generativas congeladas mediante perturbaciones en el espacio de ruido, logrando hasta un 25% más de retorno en robótica y locomoción.

2026-06-02 · 2 min

HOIST: Humanoides optimizados para cargas suspendidas

Descubre cómo HOIST combina imitación y RL para que humanoides manipulen cargas suspendidas con alta precisión. Reduce errores de colocación en 19.9 cm.

2026-06-02 · 2 min

Error por grupo, no MSE total: ajuste fino VLA para manipulación móvil

Descubre por qué el error por grupo predice mejor el rendimiento real que el MSE total en el ajuste fino de modelos VLA para robots manipuladores móviles de 11 GDL.

2026-06-02 · 2 min

RDA: Agente de diseño de recompensas para aprendizaje por refuerzo

Descubre RDA, un agente basado en VLM que diseña recompensas semánticas para robots. Logra políticas alineadas con instrucciones humanas en manipulación.

2026-06-02 · 2 min