Marco de atribución monosemántica para interpretabilidad clínica estable
Un nuevo marco de atribución monosemántica estabiliza explicaciones en modelos de lenguaje para diagnósticos de Alzheimer, mejorando la confianza.
Un nuevo marco de atribución monosemántica estabiliza explicaciones en modelos de lenguaje para diagnósticos de Alzheimer, mejorando la confianza.
Descubre ELF, una familia de modelos ECG-Lenguaje sin codificador que supera a modelos complejos con arquitecturas más simples. ¡Resultados impresionantes!
Descubre cómo la estructura de la tarea invierte la codificación de estado en modelos como Transformers y Mamba. Un estudio revela patrones opuestos en paridad y Dyck.
Descubre cómo los circuitos de consulta explican respuestas de modelos de lenguaje usando solo el 1.3% de sus conexiones. Explicaciones fieles y escalables para IA.
Descubre los modelos Hoeffding de cuello de botella conceptual: explicabilidad no lineal y robusta para imágenes aéreas.
Alineamos haces celulares con atención clasificadora para localización patológica interpretable, logrando AUC 0.953 en Camelyon16.
Descubre cómo firmas de morfología basadas en motivos permiten monitoreo ECG interpretable, detectando cambios sutiles para diagnóstico temprano.
Descubre cómo las DNNs entrenadas equivalen al grupo de renormalización en datos de familia exponencial. Una nueva teoría de interpretabilidad.
FedMTFI optimiza el aprendizaje federado heterogéneo con destilación multi-maestro y valores Shapley, mejorando precisión e interpretabilidad.
La destilación de políticas de deep RL en árboles de decisión mejora el control de redes eléctricas: mayor recompensa, supervivencia y transparencia.
Descubre MobEvolve, el primer sistema heurístico auto-evolutivo con agentes que genera trayectorias de movilidad humana interpretables y realistas, superando modelos profundos y LLM.
Las sondas de un solo cúmulo solo detectan una pequeña parte de la ejecución en Mamba-2. La similitud representacional no implica equivalencia funcional. ¡Descúbrelo!
Descubre AEyeDE: detecta texto generado por IA con mapas de atención. Mayor precisión y robustez. Señal interpretable.
¿Cómo auditar la interpretabilidad mecanicista? Proponemos un sistema de revisión colaborativa continua para generar guías verificadas. Mejora la seguridad en IA.
¿Un fiel albacea o un acceso no autorizado? La alineación de la IA depende de quién observa. Descubre el dilema del ejecutor y su impacto en la gobernanza digital.
Los SuperActivadores: tokens de cola en Transformers que señalan conceptos con alta fiabilidad, mejorando la detección en 0.14 F1. ¡Descubre el mecanismo!
Extrae algoritmos interpretables de un Transformer Discreto. Descubre cómo convertir pesos neuronales en código legible para una IA más explicable.
Descubre ReTabAD, el benchmark que restaura el contexto semántico en la detección de anomalías tabulares. Mejora rendimiento e interpretabilidad con LLM.
Descubre cómo los circuitos certificados ofrecen estabilidad demostrable en interpretabilidad mecánica: hasta 56% más precisión y 80% menos componentes.
Descubre FlagGAM: modelo explicable basado en reglas para predicción tabular. Combina precisión y robustez ante datos ruidosos. Ideal para dominios críticos.