#regularización

Relación entre CoCoA y ADMM en minimización de riesgo empírico distribuida

Descubre la relación entre CoCoA y ADMM en minimización de riesgo empírico distribuida y por qué ADMM puede superar a CoCoA.

2026-06-04 · 2 min

Pocos tokens, gran apalancamiento: preservando la alineación de seguridad durante el ajuste fino

Preserva la alineación de seguridad de tus LLMs durante el fine-tuning con PACT: restricciones focalizadas en tokens de seguridad que evitan la deriva sin sacrificar rendimiento.

2026-06-04 · 2 min

Policy Split: Exploración de modo dual en RL para LLM

Descubre cómo Policy Split mejora la exploración dual en LLMs con regularización de entropía para mayor precisión y creatividad.

2026-06-04 · 2 min

Gradiente de Política Autodestilada (SDPG)

Descubre SDPG, un marco de gradiente de política autodestilada que estabiliza el entrenamiento de LLMs mediante autorefuerzo y ventajas de grupo.

2026-06-04 · 2 min

Predicción bajo compresión imperfecta: teoría de MDL aproximado

Descubre cómo la compresión aproximada garantiza predicciones confiables en secuencias, incluso con errores de optimización. Un análisis teórico del MDL.

2026-06-04 · 3 min

AlphaQ: Asignación de bits sin calibración para cuantización de MoE

Descubre AlphaQ, un método sin calibración que asigna bits a expertos en MoE basado en la pesadez espectral. Logra compresión 4x con precisión casi total.

2026-06-04 · 3 min

OpenRFM: Diseccionando el Aprendizaje Relacional en Contexto

OpenRFM mejora un 30% el rendimiento en tareas relacionales. Su arquitectura dual y preentrenamiento inteligente superan a modelos comerciales.

2026-06-04 · 3 min

Decaimiento de bajo rango para grokking en transformers invariantes a escala

Descubre cómo el decaimiento de bajo rango (LRD) acelera el grokking en transformers invariantes a escala, comprimiendo valores singulares.

2026-06-04 · 4 min

ReLoRA: Adaptación rápida reutilizando conocimiento para servicios LLM

ReLoRA acelera la reutilización de adaptadores LoRA para servicios LLM en evolución, reduciendo tiempos de preparación hasta 8.9x y mejorando precisión un 4.6%.

2026-06-03 · 2 min

Límites de arrepentimiento dependientes de datos y varianza en MDPs tabulares

Algoritmos que logran límites de arrepentimiento adaptativos a datos y varianza en MDPs tabulares online, óptimos en entornos adversariales y estocásticos.

2026-06-03 · 2 min

Aprendizaje bayesiano disperso para núcleos de interacción Motsch-Tadmor

Aprende cómo un algoritmo SBL estima núcleos de interacción en el modelo Motsch-Tadmor, cuantificando incertidumbre a partir de datos de trayectoria.

2026-06-03 · 3 min

Recuperación parcial y consistencia débil en HSBM no uniforme

Descubre cómo un nuevo algoritmo espectral logra recuperación parcial y consistencia débil en el modelo HSBM no uniforme para detección de comunidades en hipergrafos.

2026-06-03 · 2 min

Algoritmo de gradiente no monótono para NMF simétrica y clustering

Algoritmo SNMPBB: gradiente no monótono para NMF simétrica. 6x más rápido que alternativas y superior en clustering de grafos. ¡Optimiza!

2026-06-03 · 2 min

¿Qué aprenden los estudiantes? Análisis del conocimiento oscuro

Descubre cómo la Destilación de Confusión (CD) mejora el aprendizaje de modelos sin profesor, superando a otros métodos en CIFAR-100.

2026-06-03 · 2 min

¿Qué aprenden los estudiantes? Análisis de características en KD

Analizamos el aprendizaje de características en destilación de conocimiento y presentamos Confusion Distillation, una auto-destilación eficiente que supera a otros métodos en 1.2%.

2026-06-03 · 2 min

Annot-Mix: Aprendizaje con etiquetas ruidosas de múltiples anotadores vía Mixup

Annot-Mix mejora el entrenamiento con etiquetas ruidosas de múltiples anotadores vía Mixup. Superior a 11 enfoques en 11 datasets.

2026-06-03 · 1 min

Honestidad en bosques causales: ¿cuándo ayuda o perjudica?

¿Sabías que la estimación honesta en bosques causales puede reducir la precisión? Descubre cuándo ayuda y cuándo perjudica en más de 7,000 conjuntos de datos.

2026-06-03 · 2 min

AReT: Volumetría de nódulos pulmonares con solo 3 proyecciones

Descubre AReT: la nueva técnica de IA que logra volumetría de nódulos pulmonares con solo 3 radiografías. Precisión del 98.3% y error del 11.4%.

2026-06-03 · 3 min

Reordenamiento con LLM para objetivos matizados en recomendadores

Estudio revela que el reordenamiento con LLM puede amplificar contenido extremo, pero una regularización ligera mejora la diversidad ideológica.

2026-06-03 · 2 min

Descifrando el Grokking en Regresión Ridge

Descubre cómo el grokking en regresión ridge demuestra que la generalización tardía no es un fallo de deep learning. Aprende a controlarlo con hiperparámetros.

2026-06-03 · 2 min