Aprendizaje bayesiano disperso para núcleos de interacción Motsch-Tadmor
Aprende cómo un algoritmo SBL estima núcleos de interacción en el modelo Motsch-Tadmor, cuantificando incertidumbre a partir de datos de trayectoria.
Aprende cómo un algoritmo SBL estima núcleos de interacción en el modelo Motsch-Tadmor, cuantificando incertidumbre a partir de datos de trayectoria.
Descubre LC-SAC, un algoritmo de RL que garantiza estabilidad en sistemas críticos usando Lyapunov y Koopman. Ideal para control de drones.
Descubre SPADE, el nuevo método que combina bocetos y difusión para planificar rutas de robots móviles con un 39% menos de error y un 93% menos parámetros.
Descubre TAO-RL, el nuevo marco que combina filtrado de trayectorias con exploración guiada por entropía para optimizar el razonamiento de LLMs con herramientas. Mejora la eficiencia y precisión.
Descubre cómo Wavelet Fourier Diffuser mejora el aprendizaje por refuerzo offline al corregir desplazamientos de frecuencia. Resultados superiores en D4RL.
Analizamos la nueva métrica 'contribución emergente' para medir la influencia de nodos en redes complejas. ¿Cuándo supera a la controlabilidad estática?
FiRe-OPD mejora la destilación on-policy con filtrado de trayectorias y repesado suave de tokens. Obtén +6.25 en AIME 2024 y +18.81 en Miner ¡Optimiza tus LLMs!
WRIT genera trayectorias sintéticas para entrenar agentes multi-turno con decisiones basadas en evidencia, y con solo 2K ejemplos supera a GPT-5.1.
Mejora la precisión del grounding en videos egocéntricos con fusión de trayectorias de mano. Resultados en Ego4D: +4.32% en consultas de cantidad/estado.
Descubre SERA, el método que entrena agentes de código abierto para repositorios privados con un costo 26x menor que RL. Acelera tu desarrollo con IA.
¿Sabías que las explicaciones tradicionales no bastan para IA agentiva? Descubre cómo el análisis de trazas detecta fallos de estado que reducen el éxito un 49%
Descubre MAVEN-T, un innovador marco de destilación reforzada que logra predicción de trayectorias multiagente en tiempo real con 6.2x menos parámetros y 3.7x más velocidad en Jetson Orin.
Descubre cómo los TRM resuelven el problema Lambert con J2, reduciendo errores de 340 km a 0.3 km solo con 2.3M parámetros. Ideal para misiones espaciales.
Nuevo método de aprendizaje por refuerzo reduce error de trayectoria en UAV de ala fija en un 86.77% respecto al autopiloto clásico. Descubre cómo el filtro HJB mejora la supervisión.
Descubre el clustering funcional con trayectorias log-riesgo suavizadas para datos de supervivencia. Mejora la interpretabilidad y robustez en estudios clínicos.
Aprende cómo un enfoque de máxima verosimilitud permite inferir heterogeneidad poblacional y modelos dinámicos desde trayectorias estocásticas de partículas.
Descubre d2, un marco de razonamiento para modelos de difusión que mejora el rendimiento en tareas lógicas y matemáticas, superando a RL tradicional.
Nuevo estudio muestra que los datos de trayectorias bastan para evaluar políticas en RL offline con eficiencia estadística. ¡Descúbrelo!
Descubre cómo PathCRF detecta pases y controles sin balón usando solo trayectorias. Ahorra costos y anotaciones.
Descubre cómo el algoritmo TD3 controla y estabiliza un rotor gemelo superando a PID con perturbaciones. Resultados reales.