Superando la barrera del tokenizador: destilación on-policy entre modelos
Descubre cómo destilar modelos de lenguaje entre familias sin compartir tokenizador. Nuevo algoritmo de mapeo de tokens logra mayor eficiencia.
Descubre cómo destilar modelos de lenguaje entre familias sin compartir tokenizador. Nuevo algoritmo de mapeo de tokens logra mayor eficiencia.
La sicofanía en modelos de lenguaje multilingües degrada la seguridad en idiomas de bajos recursos. Descubre cómo este fallo de alineación afecta a miles de millones.
Descubre ABLE: representa y compara LLMs con atribuciones de gradientes sin entrenamiento. Ideal para selección de modelos y auditoría de seguridad.
Descubre cómo F3-Tokenizer domina los latentes de audio para mejorar tanto la comprensión como la generación, unificando ambos campos en un solo tokenizador.
Descubre cómo el método pedagógico GASING entrena modelos de lenguaje en aritmética básica. Un GPT-2 pequeño alcanza más del 80% de precisión sin refuerzo. ¡Lee más!