#lineal

Aproximaciones neuronales certificadas de dinámicas no lineales

Nuevo método adaptativo certifica redes neuronales para dinámicas no lineales con cotas de error formales, superando al estado del arte. Ideal para sistemas críticos.

2026-06-04 · 2 min

Adalina: Aproximación Lineal Adaptativa del Valor de Shapley

Descubre Adalina, el algoritmo adaptativo que acelera la aproximación del Valor Shapley y semi-valores con espacio lineal. Ideal para atribución en IA.

2026-06-04 · 2 min

Aprendizaje offline-online en bandidos lineales

Descubre cómo nuestro algoritmo combina datos offline y exploración online en bandidos lineales para minimizar el arrepentimiento. Resultados empíricos demuestran su eficacia.

2026-06-04 · 2 min

Entrenamiento conjunto de capas en redes ReLU para modelos lineales

Aprende cómo el descenso de gradiente logra convergencia lineal en redes ReLU, evitando puntos silla y alcanzando el mínimo global.

2026-06-04 · 2 min

Más allá de simetrías: conectividad lineal vía identificabilidad neuronal

Descubre cómo la identificabilidad de neuronas permite fusionar representaciones sin alineación previa, revelando nuevas conexiones en el deep learning.

2026-06-04 · 2 min

STRIDE: Atribución de datos de entrenamiento con recuperación dispersa

Descubre STRIDE, un nuevo método que atribuye predicciones de LLM a datos de entrenamiento mediante recuperación dispersa, logrando 13 veces más rapidez que métodos anteriores.

2026-06-04 · 1 min

Auditoría empírica de codificadores de entrada para transformers de señales multicanal

Comparamos ocho codificadores de entrada para transformers de señales multicanal. Descubre cuál es el más eficiente y por qué la proyección lineal predomina.

2026-06-04 · 2 min

Direccionamiento de activaciones en modelos de video con control óptimo reducido

Aprende cómo el método LA-LQR dirige modelos de video reduciendo contenido dañino sin perder calidad. Control óptimo lineal de orden reducido.

2026-06-04 · 4 min

Agentes LLM auditables y seguros desde ontologías humanas

Descubre cómo Agentic Redux garantiza auditoría y seguridad en agentes LLM mediante ontologías humanas y cálculo lambda. Ideal para cumplimiento normativo y ciberseguridad.

2026-06-04 · 2 min

AdaKoop: Modelado eficiente de dinámicas no lineales en flujos no estacionarios

AdaKoop modela dinámicas no lineales en flujos de datos no estacionarios con eficiencia. Ideal para forecasting adaptativo en tiempo real.

2026-06-04 · 2 min

Resultado negativo: transferencia de activación entre modelos Pythia

¿Puede un modelo transmitir activaciones a otro? En nuestro experimento con Pythia, la alineación no basta para comunicación causal. Resultado negativo.

2026-06-03 · 2 min

¿Por qué las RNN lineales son más paralelizables?

Las RNN lineales ofrecen un equilibrio óptimo entre paralelización y expresividad. Descubre por qué superan a las RNN no lineales en eficiencia y su impacto en modelos de lenguaje avanzados.

2026-06-03 · 2 min

WaterSIC: Cuantización lineal casi óptima (teoría de la información)

WaterSIC: algoritmo de cuantización casi óptimo que supera a GPTQ. Nuevo récord en LLMs Llama y Qwen para 1-4 bits. ¡Mejora la eficiencia!

2026-06-03 · 2 min

NAtS-L: Búsqueda de Atención Neuronal para Modelos Híbridos por Token

Descubre cómo NAtS-L optimiza transformers combinando atención lineal y softmax por token, reduciendo coste sin perder expresividad en contextos largos.

2026-06-03 · 2 min

La forma de la suma: estructuras geométricas de la aritmética en LLMs

Descubre cómo los LLMs representan la suma geométricamente y por qué cometen errores. Un nuevo estudio revela la estructura oculta de la aritmética.

2026-06-03 · 2 min

Rex: Familia de solvers Runge-Kutta exponenciales reversibles

Descubre Rex: solvers reversibles para ODE/SDE con precisión casi de máquina en generación y edición de imágenes.

2026-06-03 · 1 min

La linealidad relacional predice alucinaciones en LLMs

Descubre cómo la linealidad relacional en modelos de lenguaje predice alucinaciones. Un nuevo estudio revela claves para entender fallos en IA.

2026-06-03 · 1 min

Destilar luego Reemplazar: Modelos Híbridos de Atención Eficientes

DtR transforma transformers preentrenados en modelos híbridos eficientes mediante destilación y reemplazo de capas. Obtén precisión con menor costo computacional.

2026-06-03 · 1 min

Contribuciones de nodos por trayectoria y límites de controlabilidad estática

Analizamos la nueva métrica 'contribución emergente' para medir la influencia de nodos en redes complejas. ¿Cuándo supera a la controlabilidad estática?

2026-06-03 · 2 min

Teoría asintótica de Chain of Thought en aprendizaje en contexto

Descubre cómo la profundidad del razonamiento en cadena afecta la generalización en modelos de lenguaje. Teoría asintótica y fases de mejora exponencial.

2026-06-03 · 2 min