#tracer

LongTraceRL: Razón de largo contexto con recompensas de rúbrica

LongTraceRL mejora el razonamiento en contexto largo usando recompensas de rúbrica y distractores por niveles desde trayectorias de agentes de búsqueda.

2026-06-01 · 1 min

TRACER: Regularización Persistente para el Ajuste Fino Multimodal Robusto

Regularización Persistente para un ajuste fino multimodal robusto con TRACER. Mejora la estabilidad y rendimiento de tus modelos multimodales.

2026-05-29 · 2 min

TRACER: Emparejamiento de Arrepentimiento a Nivel de Turno con Crédito de Refuerzo Interno para el Razonamiento Cooperativo con Múltiples LLM

2026-05-29 · 2 min

TRACER: Un marco consciente de la semántica para la detección de contaminación de grano fino en LLMs de código

2026-05-28 · 1 min