Recuperación del modelo del mundo en planificadores LLM ajustados
¿Aprenden los LLM a representar el modelo del mundo al planificar? Este análisis revela cómo el ajuste supervisado codifica la validez de acciones y predicados.
¿Aprenden los LLM a representar el modelo del mundo al planificar? Este análisis revela cómo el ajuste supervisado codifica la validez de acciones y predicados.
Descubre AlphaEval, marco de evaluación unificado y sin backtesting para minería de alfas. Evalúa poder predictivo, estabilidad, robustez y más. ¡Open source!
Descubre cómo EvoOR-Agent utiliza la coevolución de arquitecturas de agentes y razonamiento interpretable para optimizar procesos complejos con LLMs. Mejora el rendimiento y la interpretabilidad.
Descubre cómo PINNfluence interpreta las redes neuronales físicas informadas usando funciones de influencia para diagnosticar su comportamiento.
Descubre cómo un marco basado en Transformers usa entrenamiento adversarial y explicabilidad (LIME, SHAP, IG) para detectar phishing en correos de forma fiable.
Cómo adaptadores ligeros entrenados en pares vector-etiqueta logran autointerpretación que supera etiquetas y revela razonamiento implícito.
CNPC combina redes neuronales con circuitos causales para intervenciones precisas, mejorando la exactitud en modelos de caja de conceptos. ¡Resultados superiores!
SleepVLM clasifica etapas del sueño con explicaciones basadas en reglas AASM, logrando alto rendimiento y transparencia para uso clínico.
Nueva técnica: coherencia geométrica para interpretar redes neuronales. Aplicaciones en BERT y autoencoders.
HiSE es un explicador ligero para redes neuronales de grafos heterogéneos con explicaciones semánticas jerárquicas de alta fidelidad y bajo costo.
Reveal-IG: atribución basada en caminos distribucionales. Atribuciones estables con signo sin artefactos. Ideal para explicabilidad en IA.
Un estudio revela cómo las neuronas en modelos de IA se vuelven más especializadas y menos compartidas a medida que crece el tamaño del modelo. Descubre el efecto de polarización neuronal.
Descubre cómo TIDFormer revoluciona el análisis de grafos dinámicos con su mecanismo de atención eficiente e interpretable, superando modelos previos.
¿Las sondas lineales detectan razonamiento o formato? Un estudio revela que la precisión en LLMs se explica por confusores de formato, no por modos de razonamie
La cuantización no destruye todas las características interpretables: un análisis revela que el 62% persiste en INT6, pero las métricas engañan.
Descubre cómo las extensiones del framework HiPPO ofrecen memoria adaptativa y asociativa en modelos de espacio de estado, manteniendo la interpretabilidad. Un
CoSR descubre progresivamente leyes físicas desde datos, imitando el método científico. Aplicaciones en turbulencia, flujos y aerodinámica.
Descubre cómo la elección del grupo de referencia en la descomposición Oaxaca-Blinder puede revertir conclusiones clave. Aprende a evitar errores y mejorar tu análisis.
Descubre cómo el nuevo modelo bayesiano P-SMGP mejora la clasificación de señales EEG en BCI, reduciendo costos computacionales y ofreciendo interpretabilidad.
Descubre cómo las técnicas de Machine Learning permiten buscar señales sin depender de modelos teóricos, aumentando el potencial de descubrimiento.