Modelo Interpretable Estándar: teoría general con mecánica lagrangiana
Descubre cómo el SIM usa la mecánica lagrangiana para diseñar métodos interpretables. Una teoría que unifica y mejora la interpretabilidad.
Descubre cómo el SIM usa la mecánica lagrangiana para diseñar métodos interpretables. Una teoría que unifica y mejora la interpretabilidad.
Las preguntas adaptativas y sondas del modelo del mundo permiten entrenar agentes de IA que explican su comportamiento y se adaptan a cambios.
Descubre cómo un ataque dual manipula predicciones y explicaciones en clasificadores de series temporales, desafiando la confianza en la estabilidad explicativa.