FALAT: Rastreo de fallos en trayectorias LLM guiado por dependencias
FALAT: un marco que atribuye fallos en trayectorias de agentes LLM mediante búsqueda guiada por dependencias. Mejora la detección de errores decisivos.
FALAT: un marco que atribuye fallos en trayectorias de agentes LLM mediante búsqueda guiada por dependencias. Mejora la detección de errores decisivos.
Descubre cómo TraceGraph usa paisajes de decisión compartidos para diagnosticar y mejorar trayectorias de agentes IA en SWE-bench.