Compresión de LLMs mediante eliminación de bloques con optimización binaria restringida Comprime LLMs eliminando bloques con optimización binaria. Logra hasta 23% más en MMLU. Eficiente para Llama-3.3 y otros. 2026-06-18 · 2 min