De lo digital a lo físico: Agentes digitales autónomos como entrenadores
Los agentes autónomos de IA superan en un 26.5% a los ingenieros humanos en el diseño de políticas robóticas, según el benchmark EmboCoach-Bench.
Los agentes autónomos de IA superan en un 26.5% a los ingenieros humanos en el diseño de políticas robóticas, según el benchmark EmboCoach-Bench.
Investigación revela que el estimador ingenuo en RLVR mezcla elicitación y diseño de recompensas. Un nuevo método de partición causal permite auditar resultados.
Descubre RDA, un agente basado en VLM que diseña recompensas semánticas para robots. Logra políticas alineadas con instrucciones humanas en manipulación.
Aprende cómo los LLMs mejoran el diseño de recompensas en RL cooperativo multiagente, logrando mayor rendimiento en Overcooked.