ProbeScale: Análisis de Sondas para Optimizar Leyes de Escalado en SLMs
Descubre cómo ProbeScale optimiza SLMs mediante análisis de sondas, seleccionando subredes que reducen hasta 10 veces los parámetros sin perder rendimiento.
Descubre cómo ProbeScale optimiza SLMs mediante análisis de sondas, seleccionando subredes que reducen hasta 10 veces los parámetros sin perder rendimiento.
Descubre Critic-R: un marco que cierra el ciclo de retroalimentación entre agente y retriever, mejorando la precisión en búsquedas complejas sin anotaciones manuales. Resultados superiores en QA.
Descubre cómo NAMEx, basado en teoría de juegos, mejora la colaboración entre expertos en modelos MoE, logrando mayor precisión y robustez en IA.
Aprende a rastrear la responsabilidad en sistemas de IA modernos: nuestro marco cuantifica el impacto de cada etapa de desarrollo para una IA más responsable.
Descubre cómo el alcance espectral mide la capacidad de los modelos grandes para explotar señales débiles en la cola espectral, reduciendo la pérdida mediante el aprendizaje de características.
Aprende a usar el hedging en la frontera para aprender nuevas tareas con pocos ejemplos. Mejora la transferencia y selección de modelos con monotonicidad débil.
Descubre cómo TRB mejora la destilación on-policy con mezcla de comportamientos y región de confianza, logrando mejores resultados en razonamiento matemático.
ConMoE: consolidación de grupos de expertos con reasignación de prototipos para compresión de MoE. Descubre cómo comprimir modelos MoE optimizando eficiencia y rendimiento.
CIVIC: compacidad de secuencia para modelos eficientes de visión-lenguaje. Optimiza rendimiento con menor costo computacional.