#general

Twin: ajuste de tasa de aprendizaje y decay sin validación

Twin ajusta LR y weight decay sin validación, logrando error absoluto medio del 1.28%. Ideal para datos escasos o imágenes médicas. ¡Optimiza!

2026-06-08 · 2 min

Sesgos en conflicto en el borde de la estabilidad: norma vs nitidez

El aprendizaje no es solo minimizar la norma o la nitidez. Este estudio revela cómo la tasa de aprendizaje equilibra ambos sesgos implícitos. ¡Lee más!

2026-06-08 · 3 min

Generalización de modelos de difusión con espacio de representación equilibrado

Descubre cómo los modelos de difusión generalizan con representaciones equilibradas. Detecta memorización y edita sin entrenamiento.

2026-06-08 · 2 min

Tiempo hasta evento marcado: nuevo objetivo para modelos EHR

Descubre cómo un nuevo objetivo de preentrenamiento que modela el tiempo y valor de eventos clínicos mejora los modelos fundacionales EHR, logrando representaci

2026-06-08 · 2 min

Transferencia estructurada en clústeres con fuentes heterogéneas

Optimiza el transfer learning agrupando fuentes heterogéneas: Trans-GLMC mejora predicción de suicidio en hospitales.

2026-06-05 · 2 min

¿Qué tan abundantes son los buenos interpoladores?

Descubre cómo la mayoría de los interpoladores lineales tienen un rendimiento similar, y por qué algunos métodos superan al resto en inteligencia artificial.

2026-06-05 · 3 min

Reformulación de Operadores Neuronales para Evolución de Embeddings en d+1

Reformulación de operadores neuronales en d+1 para mejorar la evolución de embeddings. Menor error en benchmarks como calor y Rayleigh-Taylor.

2026-06-05 · 3 min

Operadores neuronales en d+1 dimensiones para evolución de embeddings

Descubre cómo una dimensión auxiliar en operadores neuronales mejora precisión en benchmarks de dinámica, logrando menor error L2 y generalización zero-shot.

2026-06-05 · 2 min

Leyes de escalamiento y espectros en redes neuronales superficiales

Descubre cómo las leyes de escalamiento en redes superficiales vinculan espectros de pesos y generalización, validando observaciones empíricas.

2026-06-05 · 2 min

Leyes de escalado y espectros en redes neuronales superficiales

Descubre cómo las leyes de escalado en redes superficiales explican la generalización mediante el espectro de pesos. Validación teórica.

2026-06-05 · 2 min

Desentrañando la Estructura Dinámica Oculta en Políticas Neuronales Recurrentes

Descubre cómo los ciclos límite en políticas neuronales recurrentes explican su robustez y adaptación. Análisis desde sistemas dinámicos.

2026-06-05 · 3 min

VarEOT: Transporte Óptimo Entrópico sin MCMC

Descubre VarEOT: reformulación variacional del log-partición en EOT. Entrenamiento diferenciable sin MCMC, mejores resultados en traducción de imágenes.

2026-06-05 · 4 min

Escape eficiente de puntos de silla bajo suavidad generalizada

Descubre cómo escapar eficientemente de puntos de silla en funciones no convexas con suavidad generalizada. Nuevos resultados de convergencia para métodos de primer orden.

2026-06-05 · 2 min

Marco Sliced-Wasserstein en matrices de correlación para decodificación EEG

Nuevo marco CorSW mejora la decodificación EEG con Wasserstein recortado en matrices de correlación, logrando generalización robusta a bajo costo.

2026-06-05 · 2 min

Uniendo experiencia y generalización para estimar rendimiento

Descubre FRAP, un método que combina experiencia de dominio y generalización para estimar el rendimiento de modelos sin etiquetas, incluso con cambios en la distribución de datos.

2026-06-05 · 2 min

¿Pueden los agentes generalistas automatizar la curación de datos?

Agentes generalistas automatizan la curación de datos: nuevo benchmark Curation-Bench muestra que superan métodos publicados con 10% del presupuesto.

2026-06-04 · 3 min

Sistemas de memoria agénticos: generalidad entre escenarios y baseline

AutoMEM: sistema de memoria autogestionada para agentes LLM con mejor generalidad entre escenarios gracias al control activo de almacenamiento y recuperación.

2026-06-04 · 2 min

SoLoPO: Optimización de Preferencias de Corto a Largo en LLMs

Descubre cómo SoLoPO mejora la capacidad de los LLMs para manejar contextos largos mediante optimización de preferencias de corto a largo, logrando mayor eficiencia y precisión.

2026-06-04 · 3 min

Ajuste del regularizador implícito en modelos de difusión enmascarada

Descubre cómo optimizar la distribución de probabilidad de máscara en modelos de difusión enmascarada mejora la generalización y el rendimiento en modelos de hasta 8B parámetros.

2026-06-04 · 2 min

¿El orden importa? La Ley de Robustez y la Generalización Robusta

Analizamos la conexión entre la Ley de Robustez y la generalización robusta. ¿Cómo afecta el orden de las cotas de Lipschitz a la complejidad de Rademacher? Descúbrelo.

2026-06-04 · 2 min