Bag of Dims: Interpretabilidad mecanicista sin entrenamiento
Descubre cómo patrones de signo en dimensiones de transformers revelan semántica sin entrenamiento. Nuevo enfoque: 'Bag of Dims'.
Descubre cómo patrones de signo en dimensiones de transformers revelan semántica sin entrenamiento. Nuevo enfoque: 'Bag of Dims'.
XtrAIn reemplaza la oclusión por actualizaciones de parámetros, reduciendo sesgos y drift. Logra explicaciones más estables y limpias para modelos de IA.
Descubre Causal Agent Replay, el método que identifica exactamente qué paso causó un fallo en tu agente LLM, con intervalos de confianza y código abierto.
Descubre TN-SHAP-G: calcula valores Shapley en gráficos usando redes de tensores, sin Monte Carlo. Explicabilidad eficiente para modelos complejos.
Descubre cómo los circuitos certificados ofrecen estabilidad demostrable en interpretabilidad mecánica: hasta 56% más precisión y 80% menos componentes.