Últimas noticias

SpeedAug: Aceleración de Políticas con Tempo y RL

SpeedAug acelera políticas robóticas con RL: aumenta 1.8x el rendimiento en solo 16 minutos de interacción sin comprometer la tasa de éxito.

2026-06-02 · 2 min

#robotica #aprendizaje por refuerzo #aceleración de políticas #tempo #ajuste fino #manipulación robótica #eficiencia #demostraciones #speedaug #inteligencia artificial

De Segmentos a Escenas: Comprensión Temporal en Conducción Autónoma

Conoce el benchmark TAD para conducción autónoma. Scene-CoT y TCogMap mejoran la comprensión temporal de VLMs hasta un 17.72% sin entrenamiento.

2026-06-02 · 1 min

#comprensión temporal #conducción autónoma #modelos visión-lenguaje #benchmark tad #scene-cot #tcogmap #razonamiento encadenado #mapa cognitivo #evaluación de modelos #seguridad vial

ShelfAware: Localización Semántica en Tiempo Real para Entornos Cuasi-Estáticos

ShelfAware logra localización global robusta en entornos dinámicos con sensores de bajo costo y un filtro de partículas semántico. Ideal para robots móviles.

2026-06-02 · 2 min

#localización semántica #tiempo real #sensores de bajo costo #robótica móvil #filtro de partículas #visión por computadora #almacenes inteligentes #slam #robots asistivos #entorno cuasi-estático

VocSim: Benchmark sin entrenamiento para identidad de contenido en audio

VocSim evalúa representaciones de audio sin entrenamiento usando Precision@k y GSR. Whisper + PCA logran alto rendimiento, pero falla en lenguas de bajos recursos. Código y leaderboard disponibles.

2026-06-02 · 2 min

#vocsim #benchmark #audio #zero-shot #identidad de contenido #representaciones de audio #embeddings #whisper #precision@k #separación global

InFerActive: Exploración interactiva en árbol para seguridad de LLM

InFerActive: árbol interactivo para evaluar seguridad de LLMs. Reduce hasta 5x las muestras necesarias y mejora la cobertura de respuestas dañinas.

2026-06-02 · 3 min

#inferactive #seguridad en llm #evaluación de seguridad #muestreo de llm #árbol interactivo #exploración visual #respuestas dañinas #muestreo por amplitud #cobertura de muestras #eficiencia de evaluación

Calibrando la incertidumbre en CLIP adversarial zero-shot

Descubre nuevo método de fine-tuning adversarial para CLIP calibra la incertidumbre y mejora robustez sin perder precisión en clasificación zero-shot.

2026-06-02 · 2 min

#clip #incertidumbre calibrada #ataques adversariales #zero-shot #aprendizaje automático #distribución dirichlet #robustez adversarial #fine-tuning adversarial #clasificación #inteligencia artificial

Control de un rotor gemelo mediante aprendizaje por refuerzo TD3

Descubre cómo el algoritmo TD3 controla y estabiliza un rotor gemelo superando a PID con perturbaciones. Resultados reales.

2026-06-02 · 1 min

#td3 #rotor gemelo #aprendizaje por refuerzo #control #estabilización #sistema aerodinámico #seguimiento de trayectoria #perturbaciones #pid #simulación

Ev-Trust: Confianza Evolutiva para Economías Multi-Agente con LLM

Ev-Trust reduce el fraude un 60% en economías de servicios multi-agente descentralizadas con LLM. Descubre cómo la evaluación semántica y los incentivos evolutivos estabilizan la cooperación.

2026-06-02 · 2 min

#confianza evolutiva #sistemas multi-agente #economía de servicios #llm descentralizado #verificación semántica #detección de anomalías #estrategias cooperativas #simulación multi-agente #seguridad en ia #mecanismo de confianza

Orquestación de herramientas de agentes: fuga de datos, benchmark y mitigación

Los agentes de IA con múltiples herramientas filtran datos sensibles en un 88.6% de los casos. Descubre el benchmark TOP-Bench y cómo mitigarlo con TOP-Align.

2026-06-02 · 2 min

#agentes ia #orquestación de herramientas #fuga de datos #privacidad #benchmark #mitigación #llm #composición de herramientas #top-r #seguridad en ia

MGRegBench: nuevo benchmark con landmarks anatómicos para registro mamográfico

Descubre MGRegBench: el primer dataset público con hitos anatómicos para registro de mamografías. Benchmark transparente y reproducible para investigación en IA médica.

2026-06-02 · 1 min

#registro mamográfico #benchmark #dataset #puntos de referencia anatómicos #evaluación estandarizada #deep learning #inteligencia artificial #imágenes médicas #mgregbench #mammoregnet