#fundamentación

Construcción de datasets de evaluación para razonamiento procedimental

Comparativa de estrategias de generación de preguntas para razonamiento procedimental. La generación estricta TMK logra 96.5% de preguntas fundamentadas.

2026-06-12 · 3 min

Fundamentado pero engañoso: Evaluando alineación semántica en seguridad IA

¿Son confiables las explicaciones de seguridad IA? Descubre la ilusión de fundamentación y la importancia de la alineación semántica.

2026-06-05 · 2 min

NoRA: Evaluación de razonamiento normativo visual en primera persona

Descubre NoRA, el benchmark que evalúa si los modelos de IA pueden justificar acciones razonables en video en primera persona. Un paso hacia una IA más segura.

2026-06-04 · 3 min

iML: AutoML ejecutable, basado en problemas y exploratorio

iML es un marco AutoML de código ejecutable que garantiza fiabilidad, fundamentación en datos y exploración amplia (90% de envíos válidos en benchmarks).

2026-06-02 · 2 min