Be My Tutor: destilación conjunta para mejora mutua de LLMs
Descubre cómo dos LLMs mejoran mutuamente mediante destilación conjunta y retroalimentación entre pares, logrando una mejora Pareto en múltiples dominios.
Descubre cómo dos LLMs mejoran mutuamente mediante destilación conjunta y retroalimentación entre pares, logrando una mejora Pareto en múltiples dominios.