Mecanismos de fidelidad pronominal en LLMs
Descubre cómo los modelos de lenguaje procesan los pronombres: tres mecanismos en competencia explican hasta el 99.5% de su comportamiento.
Descubre cómo los modelos de lenguaje procesan los pronombres: tres mecanismos en competencia explican hasta el 99.5% de su comportamiento.
Analizamos por qué los sistemas de orquestación con RL no llegan a producción: sesgos, incentivos y necesidad de evidencia operativa.
DemoDiffusion: robots imitan movimientos humanos con una sola demostración usando políticas de difusión preentrenadas. ¡83.8% de eficacia!
Descubre cómo el aprendizaje por refuerzo reduce cruces en grafos. Comparamos RL con heurísticas clásicas para minimizar cruces globales y locales.
Descubre CT-VDETR, un método semisupervisado que detecta traumatismos abdominales en TC 3D con solo 78 anotaciones, mejorando el rendimiento un 53%.
Descubre el aprendizaje multiescala óptimo: estimación de operadores lineales con tasas minimax y coste adaptativo.
Magnitude emerge del sigilo con $10M para revolucionar la gestión de riesgos de terceros mediante agentes de IA autónomos. Descubre cómo.
Descubre cómo el algoritmo Double KL-UCB identifica el mejor brazo minimizando el arrepentimiento acumulado. Un avance clave en bandidos multimodales con
Descubre cómo el método DPPF permite entrenar modelos con menos comunicación y mejor generalización, encontrando mínimos planos de forma colaborativa.
Descubre cómo la normalización de pesos acelera exponencialmente la convergencia en detección de matrices sobreparametrizadas. Un avance teórico clave.
Descubre cómo el Q-learning robusto con aproximación lineal converge en tiempo finito bajo incertidumbre chi-cuadrado, usando solo trayectorias markovianas.
Descubre XMedFusion, un marco de IA que integra percepción visual y razonamiento guiado para informes radiológicos precisos.
Aprende cómo el mapa completo de conexiones cerebrales de una mosca permite controlar sus movimientos con IA, abriendo camino a robots más naturales.
Extiende modelos VLA a nuevas tareas sin reentrenar, solo recuperando datos. Ahorra tiempo y recursos con esta técnica en tiempo de prueba.
PO-PDDL permite planificación robótica robusta aprendiendo modelos POMDP simbólicos de videos reales bajo incertidumbre.
Mejora el análisis de sentimientos con MAF: marco adaptativo multimodal que recupera demostraciones relevantes y fusiona similitudes para mayor precisión en
Descubre cómo DeepTrap expone vulnerabilidades contextuales en agentes de IA, yendo más allá de los prompts de usuario.
Descubre CILN, un nuevo marco para generar ruido de etiquetas realista y controlable. Evalúa el impacto de corrupciones controladas en algoritmos de
Un estudio revela que seleccionar métricas por fase no mejora la curación de demostraciones robóticas. Las métricas globales únicas son más efectivas. Descubre
NVMOS: el primer modelo que predice la calidad perceptual de vocalizaciones no verbales como risas y suspiros. Supera a expertos.