#entrenamiento

Límites pseudoespectrales en descenso de gradiente acoplado

Descubre cómo los nuevos límites pseudoespectrales revelan amplificación transitoria en gradiente acoplado. Clave para optimización bilevel y adversarial.

2026-06-04 · 2 min

SKMD: aprendizaje activo de potenciales interatómicos

Descubre cómo SKMD mejora el aprendizaje activo de potenciales interatómicos, equilibrando exploración y precisión en simulaciones moleculares. Ideal para MLIPs.

2026-06-04 · 2 min

Fusión léxico-densa sin entrenamiento para memoria conversacional

Descubre cómo fusionar BM25 con búsqueda densa late-interaction sin entrenamiento mejora hasta +17.2 puntos la recuperación de memoria en conversaciones largas. Estudio detallado.

2026-06-04 · 2 min

El borde de estabilidad modela selectivamente el aprendizaje en la distribución

Descubre cómo el borde de estabilidad redistribuye el aprendizaje entre grupos de datos, beneficiando a unos y suprimiendo a otros.

2026-06-04 · 2 min

RL en preentrenamiento de LLM: optimización temprana de políticas

Aplicar RL durante el preentrenamiento de LLM mejora rendimiento, superando al enfoque SFT→RL. Fusionar RL y SFT da mejores resultados sin perder capacidades.

2026-06-04 · 2 min

¿Cuándo bastan menos coordenadas en DP-SGD?

Descubre cuándo es posible usar menos coordenadas en DP-SGD sin perder rendimiento. El método TP-TopK optimiza el entrenamiento privado reduciendo el ruido.

2026-06-04 · 3 min

TANDEM: Optimización Bilevel de Mezcla de Datos con Redes Gemelas

Descubre TANDEM, un método que optimiza las proporciones de datos por dominio usando redes gemelas para mejorar el rendimiento de modelos de lenguaje grandes.

2026-06-04 · 2 min

La (mala) generalización del ajuste fino útil

Descubre por qué los modelos entrenados para ser siempre útiles pueden presentar fallos inesperados de alineación, sycophancy y falta de control. Aprende cómo mitigarlos.

2026-06-04 · 2 min

LC-PINN: Redes neuronales con pérdida condicional para familias paramétricas de EDP

Descubre cómo LC-PINN entrena un único modelo que resuelve toda una familia de ecuaciones diferenciales paramétricas, sin datos generados por solver.

2026-06-04 · 2 min

Entrenamiento conjunto de capas en redes ReLU para modelos lineales

Aprende cómo el descenso de gradiente logra convergencia lineal en redes ReLU, evitando puntos silla y alcanzando el mínimo global.

2026-06-04 · 2 min

Más allá de simetrías: conectividad lineal vía identificabilidad neuronal

Descubre cómo la identificabilidad de neuronas permite fusionar representaciones sin alineación previa, revelando nuevas conexiones en el deep learning.

2026-06-04 · 2 min

Repensando incompletitud: divergencia de protocolos y aprendizaje único para IMVC

Descubre CRAFT: un entrenamiento único supera la divergencia de protocolos en IMVC. Elimina reentrenamiento y logra robustez en datos faltantes.

2026-06-04 · 2 min

Adaptador de texto para TabPFN sin cuello de botella PCA

Conoce el adaptador de texto para TabPFN que elimina el cuello de botella PCA, mejorando el rendimiento en datos tabulares con texto de alta cardinalidad.

2026-06-04 · 2 min

Envenenamiento Secuencial de Datos en el Post-Entrenamiento de LLMs

Múltiples atacantes pueden envenenar datos en distintas etapas del post-entrenamiento de LLMs, revelando vulnerabilidades ocultas.

2026-06-04 · 3 min

STaR-Quant: Cuantificación post-entrenamiento para modelos de lenguaje difusos

STaR-Quant mejora la cuantificación de baja precisión en DLLMs, logrando 1.69x aceleración y 3.14x ahorro de memoria sobre FP16. Descubre cómo optimizar tu modelo.

2026-06-04 · 2 min

OpenRFM: Diseccionando el Aprendizaje Relacional en Contexto

OpenRFM mejora un 30% el rendimiento en tareas relacionales. Su arquitectura dual y preentrenamiento inteligente superan a modelos comerciales.

2026-06-04 · 3 min

STRIDE: Atribución de datos de entrenamiento con recuperación dispersa

Descubre STRIDE, un nuevo método que atribuye predicciones de LLM a datos de entrenamiento mediante recuperación dispersa, logrando 13 veces más rapidez que métodos anteriores.

2026-06-04 · 1 min

MorphoQuant: Cuantización Consciente de la Modalidad para LLMs Omni-Modales

Descubre MorphoQuant, un marco de cuantización que mantiene la precisión en modelos omni-modales con solo 4 bits, superando a modelos de 16 bits en ScienceQA.

2026-06-04 · 2 min

QuBLAST: Cuantización con Compresión por Bloques y Escalado de Activaciones

Descubre QuBLAST, un framework que reduce el tamaño de LLMs hasta un 45% mediante cuantización por bloques y escalado de activaciones, sin perder rendimiento.

2026-06-04 · 3 min

Muon supera a Adam: una perspectiva de curvatura

Muon duplica la eficiencia de Adam en LLMs gracias a menor curvatura. Descubre el análisis geométrico detrás de su ventaja.

2026-06-04 · 3 min