WRIT: Trayectorias intensivas en escritura-lectura para agentes multi-turno
WRIT genera trayectorias sintéticas para entrenar agentes multi-turno con decisiones basadas en evidencia, y con solo 2K ejemplos supera a GPT-5.1.
WRIT genera trayectorias sintéticas para entrenar agentes multi-turno con decisiones basadas en evidencia, y con solo 2K ejemplos supera a GPT-5.1.
Descubre SERA, el método que entrena agentes de código abierto para repositorios privados con un costo 26x menor que RL. Acelera tu desarrollo con IA.
¿Sabías que las explicaciones tradicionales no bastan para IA agentiva? Descubre cómo el análisis de trazas detecta fallos de estado que reducen el éxito un 49%
Descubre MAVEN-T, un innovador marco de destilación reforzada que logra predicción de trayectorias multiagente en tiempo real con 6.2x menos parámetros y 3.7x más velocidad en Jetson Orin.
Descubre cómo los TRM resuelven el problema Lambert con J2, reduciendo errores de 340 km a 0.3 km solo con 2.3M parámetros. Ideal para misiones espaciales.
Descubre el clustering funcional con trayectorias log-riesgo suavizadas para datos de supervivencia. Mejora la interpretabilidad y robustez en estudios clínicos.
Aprende cómo un enfoque de máxima verosimilitud permite inferir heterogeneidad poblacional y modelos dinámicos desde trayectorias estocásticas de partículas.
Nuevo estudio muestra que los datos de trayectorias bastan para evaluar políticas en RL offline con eficiencia estadística. ¡Descúbrelo!
Descubre cómo PathCRF detecta pases y controles sin balón usando solo trayectorias. Ahorra costos y anotaciones.
Aprende cómo SAC (Soft Actor-Critic) mejora el control de posición de quadrotors, con entrenamiento más rápido y seguimiento de rutas más suave.
SilentDrift explota la vulnerabilidad en modelos VLA para ataques backdoor sigilosos. Logra un 93.2% de éxito con solo 2% de envenenamiento. ¡Descubre cómo!
Identifica parámetros físicos desde video con datos mínimos. Sistemas subamortiguados requieren solo un clip. Sin reconstrucción de píxeles.
AffordGen genera datos diversos para manipulación robótica con generalización zero-shot. Aumenta la eficiencia del aprendizaje por imitación.
Descubre CityTrajBench, el benchmark unificado para generar trayectorias vehiculares urbanas. Compara modelos como DiffTraj, GANs y flujos. Resultados multiobjetivo clave.
Descubre cómo Geodesic Flow Matching reduce un 72% el error en SLAM neuronal y mejora un 40% la eficiencia neural mediante representaciones de alta dimensión.
Descubre cómo las Políticas de Difusión Parametrizadas (PDP) transforman el ruido en control, adaptando comportamientos robóticos sin reentrenar el modelo. Resu
TRACE comprime evidencia de riesgo en trayectorias de agentes para mejorar la seguridad en tareas de largo plazo. ¡Alta precisión!
FALAT: un marco que atribuye fallos en trayectorias de agentes LLM mediante búsqueda guiada por dependencias. Mejora la detección de errores decisivos.
Descubre cómo los modelos de lenguaje deciden: la mayoría de respuestas correctas son inestables. Estudio en Qwen, Llama y Mistral.
Aprende cómo el reenlace conservador de trayectorias mejora la continuidad de identidad en videos térmicos, sin necesidad de modelos pesados.