Aproximaciones neuronales certificadas de dinámicas no lineales
Nuevo método adaptativo certifica redes neuronales para dinámicas no lineales con cotas de error formales, superando al estado del arte. Ideal para sistemas críticos.
Nuevo método adaptativo certifica redes neuronales para dinámicas no lineales con cotas de error formales, superando al estado del arte. Ideal para sistemas críticos.
Descubre Adalina, el algoritmo adaptativo que acelera la aproximación del Valor Shapley y semi-valores con espacio lineal. Ideal para atribución en IA.
Descubre cómo nuestro algoritmo combina datos offline y exploración online en bandidos lineales para minimizar el arrepentimiento. Resultados empíricos demuestran su eficacia.
Aprende cómo el descenso de gradiente logra convergencia lineal en redes ReLU, evitando puntos silla y alcanzando el mínimo global.
Descubre cómo la identificabilidad de neuronas permite fusionar representaciones sin alineación previa, revelando nuevas conexiones en el deep learning.
Descubre STRIDE, un nuevo método que atribuye predicciones de LLM a datos de entrenamiento mediante recuperación dispersa, logrando 13 veces más rapidez que métodos anteriores.
Comparamos ocho codificadores de entrada para transformers de señales multicanal. Descubre cuál es el más eficiente y por qué la proyección lineal predomina.
Aprende cómo el método LA-LQR dirige modelos de video reduciendo contenido dañino sin perder calidad. Control óptimo lineal de orden reducido.
Descubre cómo Agentic Redux garantiza auditoría y seguridad en agentes LLM mediante ontologías humanas y cálculo lambda. Ideal para cumplimiento normativo y ciberseguridad.
AdaKoop modela dinámicas no lineales en flujos de datos no estacionarios con eficiencia. Ideal para forecasting adaptativo en tiempo real.
¿Puede un modelo transmitir activaciones a otro? En nuestro experimento con Pythia, la alineación no basta para comunicación causal. Resultado negativo.
Las RNN lineales ofrecen un equilibrio óptimo entre paralelización y expresividad. Descubre por qué superan a las RNN no lineales en eficiencia y su impacto en modelos de lenguaje avanzados.
WaterSIC: algoritmo de cuantización casi óptimo que supera a GPTQ. Nuevo récord en LLMs Llama y Qwen para 1-4 bits. ¡Mejora la eficiencia!
Descubre cómo NAtS-L optimiza transformers combinando atención lineal y softmax por token, reduciendo coste sin perder expresividad en contextos largos.
Descubre cómo los LLMs representan la suma geométricamente y por qué cometen errores. Un nuevo estudio revela la estructura oculta de la aritmética.
Descubre Rex: solvers reversibles para ODE/SDE con precisión casi de máquina en generación y edición de imágenes.
Descubre cómo la linealidad relacional en modelos de lenguaje predice alucinaciones. Un nuevo estudio revela claves para entender fallos en IA.
DtR transforma transformers preentrenados en modelos híbridos eficientes mediante destilación y reemplazo de capas. Obtén precisión con menor costo computacional.
Analizamos la nueva métrica 'contribución emergente' para medir la influencia de nodos en redes complejas. ¿Cuándo supera a la controlabilidad estática?
Descubre cómo la profundidad del razonamiento en cadena afecta la generalización en modelos de lenguaje. Teoría asintótica y fases de mejora exponencial.