Explicando neuronas activadas por ausencias
Descubre cómo la IA explicable revela neuronas activadas por la ausencia de conceptos y mejora la eliminación de sesgos en modelos profundos.
Descubre cómo la IA explicable revela neuronas activadas por la ausencia de conceptos y mejora la eliminación de sesgos en modelos profundos.
Descubre cómo ELA, usando divergencia KL y mapeo cuantil beta, reduce un 30% el tiempo de entrenamiento al podar capas redundantes en atención por capas.
Descubre los nuevos límites de convergencia no asintóticos para Engression y Reverse Markov Engression. Resultados casi óptimos para aprendizaje de distribuciones condicionales con redes profundas.
Las redes profundas aprenden a analizar lenguajes libres de contexto usando solo estadísticas locales. Un estudio revela cómo emergen representaciones jerárquicas.
Por primera vez, se demuestran cotas de generalización no triviales para redes profundas sin modificaciones, incluso con 600M parámetros. Análisis basado en la geometría de los datos.
¿Sabías que DQN y PPO aprenden representaciones invariantes diferentes? Descubre cómo afecta a la transferencia y la neurociencia.
La restricción semi-ortogonal en capas de congruencia limita la expresividad de DNNs para matrices PD. Comparativa de clasificadores Riemannianos.
Descubre cómo las simetrías en el espacio de pesos facilitan la estimación de la curvatura en redes neuronales, mejorando la optimización y reduciendo costos computacionales.
Descubre CEAR: mejora la robustez adversarial certificada en DNNs usando ensambles con ruido y votación. Superior en MNIST, CIFAR10 y TinyImageNet.
Nuevo método bayesiano que combina filtrado de Kalman y selección de modelos para dinámicas neuronales, mejorando incertidumbre y escalabilidad. ¡Descúbrelo!
La regresión espuria profunda revela cómo los atajos engañan a modelos de IA en predicciones continuas. Aprende a detectarlos y generalizar.
Descubre cómo Group RC-DMC mejora las recomendaciones grupales usando aprendizaje profundo y restricciones de rango, superando la escasez de datos.
Descubre cómo el enmascaramiento de observaciones obsoletas afecta a los agentes de búsqueda. Aprende cuándo mejora y cuándo empeora el rendimiento.
LLMs sin Deep Learning: nueva arquitectura RBF que encuentra el óptimo global en una iteración, eliminando el tedioso entrenamiento.
El modelo GCSER-UNet alcanza un 94% Dice en TCGA LGG y 95% en BraTS 2020 para segmentación de tumores cerebrales. Descubre su innovadora atención global.
Descubre PC-ALM: un algoritmo de codificación predictiva que iguala el rendimiento de la retropropagación usando dinámicas locales. Ideal para redes profundas.
Descubre ELUDe, un método innovador que desenreda conceptos en redes neuronales profundas sin afectar su rendimiento. Interpretabilidad clara y práctica.
Descubre por qué la linearización de la última capa ofrece una cuantificación de incertidumbre comparable a la de toda la red, con mucha mayor eficiencia computacional. Estudio teórico y empírico.
Descubre cómo las redes neuronales ReLU profundas logran tasas de aproximación óptimas para funciones suaves anisotrópicas y mixtas, superando la maldición de la dimensionalidad.
CHONN: redes de alto orden inspiradas en circuitos unifican dinámicas neuronales para resolver PDEs y mejorar percepción visual. Modelado estable y eficiente.