#explicabilidad ia

Bag of Dims: Interpretabilidad mecanicista sin entrenamiento

Descubre cómo patrones de signo en dimensiones de transformers revelan semántica sin entrenamiento. Nuevo enfoque: 'Bag of Dims'.

2026-06-12 · 2 min

XtrAIn: Atribución de características mediante oclusión guiada por entrenamiento

XtrAIn reemplaza la oclusión por actualizaciones de parámetros, reduciendo sesgos y drift. Logra explicaciones más estables y limpias para modelos de IA.

2026-06-10 · 2 min

Causal Agent Replay: Atribución Contrafactual de Fallos en Agentes LLM

Descubre Causal Agent Replay, el método que identifica exactamente qué paso causó un fallo en tu agente LLM, con intervalos de confianza y código abierto.

2026-06-09 · 1 min

TN-SHAP-G: Red tensorial para Shapley en gráficos

Descubre TN-SHAP-G: calcula valores Shapley en gráficos usando redes de tensores, sin Monte Carlo. Explicabilidad eficiente para modelos complejos.

2026-06-02 · 3 min

Circuitos Certificados: Garantías de Estabilidad para Circuitos Mecanísticos

Descubre cómo los circuitos certificados ofrecen estabilidad demostrable en interpretabilidad mecánica: hasta 56% más precisión y 80% menos componentes.

2026-06-01 · 2 min