No Todas las Habilidades Ayudan: Midiendo y Reparando el Conocimiento de Agentes
Descubre cómo ASSAY separa generación y curación de habilidades en agentes LLM, mejorando rendimiento sin modificar pesos. ¡Nuevo SOTA en AppWorld!
Descubre cómo ASSAY separa generación y curación de habilidades en agentes LLM, mejorando rendimiento sin modificar pesos. ¡Nuevo SOTA en AppWorld!
ACCORD mejora hasta un 20.6% el rendimiento de agentes de lenguaje mediante anclaje contextual condicionado por acción, sin entrenamiento adicional.
ACCORD mejora hasta un 20% el desempeño de agentes de lenguaje. Descubre este marco que integra contexto y optimiza tareas sin entrenamiento adicional.
Los agentes de IA fallan en silencio. Aprende a detectar el falso éxito con métodos ligeros que superan a los jueces LLM.