Desfase fronterizo: auditoría de la tergiversación en evaluaciones de IA
Un estudio analiza 112,303 registros y revela que las evaluaciones académicas de IA están atrasadas hasta 1.4 generaciones de modelos. Descubre el 'publication elicitation gap'.