Más allá de modelos aditivos: separabilidad e interpretabilidad
Descubre Tensor Separation Learning, método de regresión que supera modelos aditivos (GAMs, SHAP) ofreciendo visualizaciones fieles sin cancelación de señales.
Descubre Tensor Separation Learning, método de regresión que supera modelos aditivos (GAMs, SHAP) ofreciendo visualizaciones fieles sin cancelación de señales.
Los nuevos autoencoders dispersos identificables (iSAE) mejoran la estabilidad y precisión en la interpretación de redes neuronales. Aprende más.
Descubre ELUDe, un método innovador que desenreda conceptos en redes neuronales profundas sin afectar su rendimiento. Interpretabilidad clara y práctica.
Descubre ELUDe, método que mejora interpretabilidad sin sacrificar rendimiento. Desenreda polisemia neuronal manteniendo precisión. ¡Lee más!
Descubre cómo los valores atípicos en las activaciones neuronales provocan la muerte de características en autoencoders dispersos y cómo solucionarlo con centrado de media.
Descubre por qué la interpretabilidad mecanicista es inestable y cómo abordarlo con rigor estadístico. Aprende a medir la varianza en circuitos de IA.
Descubre M-CBE, una nueva arquitectura que combina múltiples expertos en modelos de cuello de botella conceptual para mejorar la precisión sin sacrificar la interpretabilidad.
Evaluamos la direccionalidad a objetivos en agentes de lenguaje con análisis conductual y representacional. Descubre cómo entender su comportamiento.
Descubre cómo un pequeño transformer aprende el mapa zeta en caminos de Dyck, y cómo la interpretabilidad mecánica revela un nuevo algoritmo verificable por humanos.
Descubre DEM, un modelo de detección de anomalías interpretable y ultrarrápido para redes de sensores fisiológicos. Precisión del 99.64% sin sacrificar explicabilidad.
Descubre STEP, un método innovador que aprende representaciones interpretables de series temporales progresivas usando un compás latente. Predice estados y modos sin etiquetas.
Los Autoencoders Dispersos (SAEs) superan líneas base simples en el control de LLMs, igualando a LoRA en AxBench. Características seleccionadas con pipeline sup