Cuatro sobre seis: cuantización NVFP4 más precisa con escalado de bloque adaptativo
Mejora la precisión en cuantización NVFP4 con escalado de bloque adaptativo. Descubre el método Cuatro sobre seis para optimización de modelos.
Mejora la precisión en cuantización NVFP4 con escalado de bloque adaptativo. Descubre el método Cuatro sobre seis para optimización de modelos.
TetraJet-v2 optimiza el entrenamiento NVFP4 en LLMs suprimiendo oscilaciones y outliers para lograr mayor precisión.