Aprendizaje online de habilidades con recuperación dinámica basada en estado
SGDR revoluciona el aprendizaje de habilidades en agentes web: recuperación dinámica basada en estado mejora un 10% la tasa de éxito en WebArena. ¡Conoce los detalles!
SGDR revoluciona el aprendizaje de habilidades en agentes web: recuperación dinámica basada en estado mejora un 10% la tasa de éxito en WebArena. ¡Conoce los detalles!
Descubre cómo el cacheo de prompts reduce hasta 10x el costo en Claude y 2x en GPT-4o, permitiendo prompts de sistema de 20K tokens para mejorar la calidad de salida.
Descubre ChatSOP: guía agentes de diálogo con SOP y MCTS. Aumenta precisión en acciones un 28%. ¡Prueba el marco!
Los chatbots médicos fallan hasta en un 80% ante ataques multi-turno. Descubre cómo MultiTurnPSB revela vulnerabilidades y las defensas con clasificadores.
Descubre cómo los algoritmos de AutoEval usan datos sintéticos para reducir costos de anotación humana y aumentar la muestra efectiva hasta un 50% con GPT-4.
Nuevo método evolutivo basado en MAP-Elites revela vulnerabilidades específicas en modelos como GPT-4o y Claude, mejorando la seguridad y robustez de los LLMs.
Descubre cómo ToMAP, un modelo de 3B parámetros, supera a GPT-4o en persuasión usando Teoría de la Mente. Aumenta efectividad un 39.4%.
Aprende a evaluar y reducir el sesgo en el código generado por GPT-4o y Gemini. Analizamos métricas CBS, ACR y estrategias de mitigación para lograr equidad en IA.
Descubre cómo la profundidad de inyección y el framing del payload determinan el éxito de ataques en agentes ReAct. Estudio revela riesgos clave en seguridad de IA.
Descubre la paráfrasis generada por GPT-4o que mejora la traducción de lengua de señas en PHOENIX14T, pero revela límites en conjuntos extremos.