#llamadas a herramientas

SAW: Ponderación Dinámica por Etapas para RL Multiobjetivo en LLMs

Mejora el alineamiento de LLMs con SAW, ponderación dinámica que optimiza el aprendizaje multiobjetivo sin apenas coste computacional.

2026-06-16 · 2 min

PACT: Entrenamiento Conjunto con Trazas Privilegiadas para Agentes Multiturno

Descubre cómo PACT mejora agentes multiturno combinando trazas expertas con RL y SFT para optimizar el uso de herramientas sin restringir la generación.

2026-06-16 · 2 min

Agenvoy v0.26.9 – Mejoras en gestión de modelos, enrutamiento y saneamiento

Descubre las novedades de Agenvoy v0.26.9: mejoras en gestión de modelos, enrutamiento con prompts, soporte Grok OAuth y un cache unificado para mayor seguridad y eficiencia.

2026-06-11 · 2 min

IAPO: Optimización con atribución de entrada para agentes multimodales

Aumenta un 3% la precisión en VQA con IAPO, algoritmo RL que alinea la atribución de entrada en agentes multimodales pequeños. ¡Descubre cómo!

2026-06-11 · 2 min

STAGE-Claw: Evaluación automatizada de agentes en escenarios realistas

Descubre STAGE-Claw, un framework automatizado que evalúa agentes de IA en escenarios realistas midiendo la corrección del estado final del sistema. Ideal para benchmarks.

2026-06-10 · 3 min

Construyendo agentes de IA con Vercel AI SDK

Aprende a construir agentes de IA con Vercel AI SDK. Este tutorial te guía en la creación de un agente de triaje de soporte con múltiples herramientas y control de pasos.

2026-06-09 · 4 min

La brecha sim-to-real de los agentes con modelos fundacionales

Descubre cómo la brecha sim-to-real afecta a los agentes con modelos fundacionales y cómo una perspectiva unificada de MDP puede mejorar su robustez en aplicaciones reales.

2026-06-08 · 2 min