#masc

Enmascaramiento de tokens basado en divergencia KL de entropía: un enfoque novedoso para el ajuste fino selectivo de modelos de lenguaje grandes

Optimiza LLMs con enmascaramiento de tokens y divergencia KL. Técnica de ajuste fino selectivo para mejorar eficiencia y rendimiento en modelos de lenguaje grandes.

2026-05-30 · 3 min

FHRFormer: Un marco de trabajo de Transformer enmascarado auto-supervisado para la imputación y predicción de series temporales de frecuencia cardíaca fetal

Descubre FHRFormer, un transformer auto-supervisado que imputa y predice la frecuencia cardíaca fetal con alta precisión.

2026-05-30 · 1 min

AnyMo: Escalando la generación condicional de movimiento de cualquier modalidad con modelado enmascarado

2026-05-29 · 2 min

DLM-SWAI: Dirigiendo modelos de lenguaje de difusión antes de que se desenmascaren

2026-05-29 · 2 min

Decodificación paralela guiada por atención a nivel de clúster para modelos de lenguaje de difusión enmascarados

Decodificación paralela guiada por atención de clúster optimiza modelos de difusión enmascarados para generación eficiente.

2026-05-29 · 3 min

Causal-JEPA: Aprendizaje de Modelos del Mundo a través de Enmascaramiento Latente a Nivel de Objeto

2026-05-29 · 2 min

Cambio de mecanismo durante el posentrenamiento de modelos de lenguaje autorregresivos a modelos de difusión enmascarada

2026-05-29 · 3 min

Enmascaramiento consciente de la entropía para el modelado de lenguaje enmascarado

2026-05-29 · 2 min

Aprendizaje de Representaciones Generativas en Grafos de Conocimiento Hiper-relacionales mediante Difusión Discreta Enmascarada

2026-05-28 · 1 min