¿Qué deben decir los agentes? Comunicación acción-estado eficiente
Descubre cómo PACT optimiza la comunicación acción-estado en MAS, reduciendo tokens y mejorando rendimiento. ¡Ahorra costos!
Descubre cómo PACT optimiza la comunicación acción-estado en MAS, reduciendo tokens y mejorando rendimiento. ¡Ahorra costos!
ReTreVal permite a LLMs aprender entre problemas durante la inferencia, mejorando el razonamiento sin ajuste fino. Logra 85.8% en MATH-500 y 54.4% en MMLU-Pro.
ReasoningFlow revela patrones discursivos en trazas de LLM, mejorando la transparencia y el análisis del razonamiento automático.
Descubre cómo Alpha-RTL reduce el producto PPA en un 65% mediante entrenamiento en tiempo de prueba con retroalimentación EDA, superando métodos tradicionales.
NF-CoT: razonamiento latente con flujos normalizadores para código eficiente y preciso. Supera a la cadena de pensamiento tradicional.
Descubre cómo este marco de ranking consciente de jueces mejora evaluaciones de LLMs sin etiquetas de referencia, optimizando fiabilidad y eficiencia.
MAPL comprime activaciones en paralelismo de tubería con proyecciones ortogonales aprendidas, reduce comunicación sin pérdida de rendimiento en modelos LLaMA.
Optimiza el uso de modelos de lenguaje: MetaRouter utiliza meta-aprendizaje para personalizar el enrutamiento según tus necesidades, reduciendo costes sin sacrificar rendimiento.
Recover-LoRA recupera hasta 95% de precisión en modelos de 2 bits usando adaptación de bajo rango y destilación con solo 10k datos sintéticos.
Descubre cómo GA-ICL, un método de selección de ejemplos con conciencia geométrica, mejora la detección de alucinaciones en LLMs sin modificar parámetros.
Investigación revela que los modelos de lenguaje grandes confunden el valor moral, gramatical y económico. Descubre cómo la ablación selectiva corrige este entrelazamiento y mejora la alineación.
SFMP: cuantización mixta sin búsqueda y amigable con hardware para LLMs. Reduce costos y mejora eficiencia.
Descubre un nuevo marco estadístico con variables latentes para predecir rendimiento de LLMs en múltiples benchmarks. Ideal para entender leyes de escalado.
Descubre cómo un currículo de RL permite a LLMs generalizar procedimientos entre código y lenguaje natural, igualando a GPT-4o.
Descubre cómo Policy Split mejora la exploración dual en LLMs con regularización de entropía para mayor precisión y creatividad.
Aprende cómo Generative Augmented Inference (GAI) combina datos de IA y humanos para una inferencia causal más precisa, reduciendo errores y mejorando intervalos de confianza.
Descubre cómo la optimización de gradiente bidireccional permite atribuir datos de entrenamiento en LLMs, mejorando la interpretabilidad y accountability de los sistemas de IA.
Descubre MorphoQuant, un marco de cuantización que mantiene la precisión en modelos omni-modales con solo 4 bits, superando a modelos de 16 bits en ScienceQA.
DSIRM mejora la relevancia en búsqueda de e-commerce con identificadores semánticos discretos y cuantización contrastiva, logrando +1.54% AUC y +0.13% UCTR.
Aprende cómo el marco SCORE mejora informes de investigación mediante la co-evolución de generación y evaluación, superando recompensas fijas.