#inferencia dinámica

Agentes de Recompensa de Proceso para Guiar el Razonamiento Intensivo

Descubre cómo los PRA mejoran el razonamiento intensivo en conocimiento con recompensas paso a paso, logrando 81.9% en MedQA con Qwen3-4B.

2026-06-03 · 1 min

MPMWorlds: Simulaciones MPM para inferir y extrapolar dinámicas físicas

Descubre MPMWorlds, un dataset de simulaciones físicas con el Método de Puntos Materiales. Comparamos generación de código y difusión de video para inferir y extrapolar dinámicas. ¡Lee más!

2026-06-02 · 2 min