Aprendizaje de autocorrección en modelos visión-lenguaje mediante aumento de trayectorias
Descubre cómo Octopus-8B logra autocorrección eficiente en VLMs mediante aumento de trayectorias, superando a otros modelos con un 1.0 de puntuación y menor tiempo de entrenamiento.