SpeedAug: Aceleración de Políticas con Tempo y RL
SpeedAug acelera políticas robóticas con RL: aumenta 1.8x el rendimiento en solo 16 minutos de interacción sin comprometer la tasa de éxito.
Cobertura diaria sobre inteligencia artificial, desarrollo de software, cloud y negocio tech. Descubre resúmenes claros y enlaces a las fuentes originales.
SpeedAug acelera políticas robóticas con RL: aumenta 1.8x el rendimiento en solo 16 minutos de interacción sin comprometer la tasa de éxito.
Conoce el benchmark TAD para conducción autónoma. Scene-CoT y TCogMap mejoran la comprensión temporal de VLMs hasta un 17.72% sin entrenamiento.
ShelfAware logra localización global robusta en entornos dinámicos con sensores de bajo costo y un filtro de partículas semántico. Ideal para robots móviles.
VocSim evalúa representaciones de audio sin entrenamiento usando Precision@k y GSR. Whisper + PCA logran alto rendimiento, pero falla en lenguas de bajos recursos. Código y leaderboard disponibles.
InFerActive: árbol interactivo para evaluar seguridad de LLMs. Reduce hasta 5x las muestras necesarias y mejora la cobertura de respuestas dañinas.
Descubre nuevo método de fine-tuning adversarial para CLIP calibra la incertidumbre y mejora robustez sin perder precisión en clasificación zero-shot.
Descubre cómo el algoritmo TD3 controla y estabiliza un rotor gemelo superando a PID con perturbaciones. Resultados reales.
Ev-Trust reduce el fraude un 60% en economías de servicios multi-agente descentralizadas con LLM. Descubre cómo la evaluación semántica y los incentivos evolutivos estabilizan la cooperación.
Los agentes de IA con múltiples herramientas filtran datos sensibles en un 88.6% de los casos. Descubre el benchmark TOP-Bench y cómo mitigarlo con TOP-Align.
Descubre MGRegBench: el primer dataset público con hitos anatómicos para registro de mamografías. Benchmark transparente y reproducible para investigación en IA médica.
Aprende cómo SAC (Soft Actor-Critic) mejora el control de posición de quadrotors, con entrenamiento más rápido y seguimiento de rutas más suave.
El ajuste dinámico de entropía en RL mejora el control de drones, evitando olvido catastrófico y optimizando la exploración. Comparativa SAC vs TD3.