Repensando la granularidad: compresión de LLM con SubFit
SubFit comprime LLMs a nivel de submódulos con selección no contigua. Mejora el equilibrio precisión-perplejidad, acelera inferencia y ahorra memoria KV-cache. ¡Más eficiente!
SubFit comprime LLMs a nivel de submódulos con selección no contigua. Mejora el equilibrio precisión-perplejidad, acelera inferencia y ahorra memoria KV-cache. ¡Más eficiente!
Aprende cómo la complejidad de los datos define el presupuesto mínimo de parámetros para el razonamiento implícito en modelos de lenguaje.
Predice la calidad de tus prompts con EMoE: incertidumbre sin entrenamiento en difusión texto-imagen.
DIBS: clonación conductual desacoplada para generalización inductiva escalable en RL con entrenamiento estable y rendimiento zero-shot.
Descubre Ryze, un sistema que automatiza la creación de datasets enriquecidos con evidencia visual a partir de papers biomédicos, superando a GPT-5.
Descubre HomeFlow, un innovador sistema que utiliza un volante de datos verificable para entrenar agentes de hogar inteligente, superando incluso a GPT-5.5 en tareas domésticas.
Descubre cómo ANDES, una herramienta de síntesis evolutiva de datos, permite a agentes IA alinear instrucciones de forma autónoma y mejorar el rendimiento en post-entrenamiento.
Descubre cómo medir la efectividad del tool-calling en agentes LLM y cómo optimizar el entrenamiento RL para mayor eficiencia. Aprende técnicas de aceleración sin perder rendimiento.
Descubre BudgetDraft: entrenamiento multi-vista acelera decodificación especulativa con KV disperso hasta 6.55x en contextos de 4K a 16K, optimizando memoria.
Descubre cómo DART adapta el modelo en tiempo de prueba para mejorar el reranking sin datos etiquetados, logrando +2.1% en NDCG@10 con mínima latencia.
ThinkSwitch combina destilación de contexto con LoRA e interpolación de pesos para mejorar modelos de lenguaje en razonamiento, reduciendo costos y latencia sin sacrificar precisión.
Con HASTE, el entrenamiento disperso dinámico consciente del hardware logra hasta 25x de aceleración en backpropagation para clasificación multi-etiqueta extrema.
Optimiza el escalado de modelos dispersos con datos limitados. Descubre leyes de escalado, saturación retardada y compensaciones clave.
Descubre SkillAdaptor, un marco sin entrenamiento que adapta habilidades de agentes LLM paso a paso, mejorando éxito en WebShop, PinchBench y Claw-Eval.
Descubre cómo las fronteras de Pareto y la optimización automatizada revelan rendimientos superiores en entrenamiento certificado.
Descubre cómo el control de grupo adaptativo reduce los retrasos por rezagados en RL síncrono, acelerando el entrenamiento y mejorando el rendimiento en benchmarks.
¿Cómo acelerar el entrenamiento VLM sin perder sinergia? Descubre la asimetría en atención y los límites de la reducción de tokens. Estrategias clave.
AlphaToken mejora el post-entrenamiento de LLMs al valorar tokens, evitando el olvido catastrófico y enfocando el aprendizaje en tokens valiosos.
Descubre cómo LLMs listos para usar mejoran el razonamiento matemático sin entrenamiento, superando la votación mayoritaria hasta 28%.
Descubre THRD, el primer marco sin entrenamiento que detecta ataques multi-turno en LLMs analizando riesgo acumulativo. Reduce éxito de ataques a menos del 4%.