#regularización

Repensando la Regularización de Divergencia en RL para LLMs

Descubre DRPO: un nuevo método que reemplaza el recorte de ratio con regularización cuadrática suave para estabilizar el entrenamiento RL en modelos de lenguaje.

2026-06-09 · 1 min

Calibración de normalidad en detección de anomalías en grafos semisupervisada

GraphNC calibra la normalidad en detección de anomalías en grafos. Usa datos etiquetados y no etiquetados para reducir falsos positivos y mejorar la precisión.

2026-06-09 · 1 min

Aprendizaje continuo orientado a decisiones para logística portuaria

Optimiza la programación logística portuaria con aprendizaje continuo, mejorando la generalización y reduciendo costos. ¡Lee más!

2026-06-09 · 4 min

Enmascaramiento Espacial por Energía: Robustez e Interpretabilidad en Visión

Descubre cómo ERSM mejora la robustez e interpretabilidad de modelos de visión al reducir redundancias y aislar objetos.

2026-06-09 · 2 min

Generalización en Mínimos Cuadrados No Lineales vía Geometría Aprendida

Aprende cómo la geometría de características aprendidas mejora la generalización en mínimos cuadrados no lineales, reduciendo la dependencia de parámetros.

2026-06-09 · 2 min

Curvas de generalización en algoritmos espectrales con decaimiento de potencia

Descubre las curvas de error de generalización en regresión kernel con decaimiento de potencia y su impacto en redes neuronales anchas.

2026-06-09 · 2 min

Complejidad de muestreo en optimización convexa sin parámetros

Descubre cómo mejorar la optimización convexa estocástica cuando se desconocen parámetros clave. Métodos para evitar sobreajuste y lograr complejidad de muestreo óptima.

2026-06-09 · 2 min

Recompensa moldeada para alineación en inferencia: Juego de Stackelberg

Descubre cómo el moldeado de recompensas desde la perspectiva del juego de Stackelberg mejora la alineación de LLMs en inferencia, reduciendo sesgos y aumentando el rendimiento.

2026-06-09 · 1 min

Hyperflux: La poda revela la importancia

Descubre Hyperflux, un método de poda que revela la importancia de cada peso mediante flujo y presión. Reduce latencia y energía manteniendo precisión.

2026-06-09 · 2 min

Detectar y mitigar sesgos con equidad como simetría

Descubre cómo tratar la equidad como operación de simetría reduce sesgos en modelos de IA hasta un 90% con solo un 5% de pérdida de precisión.

2026-06-08 · 2 min

SCALE: Planificación escalable de workflows agénticos con atención cruzada

SCALE es un planificador DRL que escala a clústeres de cualquier tamaño sin reentrenamiento, reduciendo el tiempo de respuesta hasta un 8.9%.

2026-06-08 · 2 min

Razonamiento estable, respuestas inestables: clave contra el engaño en LLM

Descubre cómo la asimetría de estabilidad entre el razonamiento interno y las respuestas externas revela el engaño en LLMs, y cómo una nueva regularización lo mitiga sin perder capacidad.

2026-06-08 · 2 min

Preentrenamiento con datos limitados: regularización mejorada y leyes de escalado

La regularización MIR y la ley SoftQ mejoran el preentrenamiento con datos limitados, equivalente a 1.3 veces más datos.

2026-06-08 · 3 min

Pretraining de modelos de lenguaje con datos limitados: regularización y escalado

Nuevo estudio propone regularización MIR y ley de escalado SoftQ para pretraining con datos limitados, logrando mejoras equivalentes a 1.3x más datos únicos.

2026-06-08 · 2 min

Construyendo espacios latentes de VAE con topología prescrita

Aprende a construir espacios latentes de VAE con topología prescrita, resolviendo el desajuste topológico y mejorando la calidad de reconstrucción en datos no euclidianos. Resultados superiores.

2026-06-08 · 2 min

Regularización espectral en forma cerrada para fusión de modelos multitarea

Descubre cómo SWUDI resuelve la fusión de modelos multitarea con regularización espectral cerrada, acelerando 28-72x sin datos de entrenamiento.

2026-06-08 · 3 min

Contracción de covarianza con interpolación estocástica

Descubre la contracción de covarianza con interpolación estocástica: reduce riesgo y permite regularización de autovectores. Aplicaciones en neuroimagen.

2026-06-08 · 1 min

Generación musical con datos limitados: entrenamiento consciente de puntuación

Descubre cómo el entrenamiento consciente de puntuación permite generar música de alta calidad con pocos datos. Nuestro modelo FluxAudio rankeó 2° en ICME 2026.

2026-06-08 · 3 min

Detección de cambios en sistemas dinámicos ruidosos con operadores empíricos

Descubre cómo detectar cambios en sistemas dinámicos ruidosos usando operadores de transferencia empíricos. Aprende el método con garantías de falsa alarma y aplicaciones en series temporales.

2026-06-08 · 2 min

Contracción de covarianza vía interpolación estocástica

Nuevo enfoque: interpolación estocástica para contraer covarianza. Descubre tres mecanismos (planificación, flujo, parada temprana) que reducen el riesgo estadístico en datos de alta dimensionalidad.

2026-06-08 · 2 min