MAF: Prompting Adaptativo Multimodal para Análisis de Sentimientos
Mejora el análisis de sentimientos con MAF: marco adaptativo multimodal que recupera demostraciones relevantes y fusiona similitudes para mayor precisión en
Mejora el análisis de sentimientos con MAF: marco adaptativo multimodal que recupera demostraciones relevantes y fusiona similitudes para mayor precisión en
Descubre cómo DeepTrap expone vulnerabilidades contextuales en agentes de IA, yendo más allá de los prompts de usuario.
Descubre CILN, un nuevo marco para generar ruido de etiquetas realista y controlable. Evalúa el impacto de corrupciones controladas en algoritmos de
Un estudio revela que seleccionar métricas por fase no mejora la curación de demostraciones robóticas. Las métricas globales únicas son más efectivas. Descubre
NVMOS: el primer modelo que predice la calidad perceptual de vocalizaciones no verbales como risas y suspiros. Supera a expertos.
NASA ordenó refugio en Dragon ante plan ruso de cortar un segmento con fugas en la ISS. Descubre los riesgos y posibles soluciones.
GAS-Leak-LLM usa algoritmos genéticos para crear sufijos adversariales y eludir la seguridad de los LLM en caja negra. Estudio revela vulnerabilidades.
NVMOS es el primer modelo que mide la calidad perceptiva de vocalizaciones no verbales (risas, suspiros, tos) superando a modelos multimodales. Descubre su
Descubre cómo ControlMap genera mapas HD realistas siguiendo topologías de carreteras específicas con control espacial y transferencia de estilo urbano.
Descubre Open-SWE-Traces, 207K trayectorias para agentes de software. Logra 61.7% en SWE-bench Verified. Infórmate!
Red neuronal profunda detecta portadores de carga y estima su pose usando visión RGBD para logística autónoma.
Descubre cómo diseñar contratos de seguro para agentes IA autónomos resistentes a manipulación estratégica. Un mecanismo de peaje innovador que garantiza
Descubre ATOM-Bench: benchmark para evaluar habilidades atómicas y generalización composicional en robótica. Conoce los resultados clave.
¿Cansado del ruido sintético? Conoce nuestro benchmark realista para segmentación federada con ruido real en etiquetas. Elige el mejor método FNLL.
DREAM mejora el razonamiento matemático de LLMs mediante lógica de primer orden, logrando hasta un 6.4% de mejora.
Descubre AIQI, el primer agente de IA universal sin modelo que logra optimalidad asintótica en aprendizaje por refuerzo general. Un avance revolucionario.
Descubre SorryDB, el benchmark dinámico que evalúa la capacidad de la IA para demostrar teoremas reales de Lean. ¿Qué tan avanzados están los demostradores
Descubre SorryDB, un benchmark dinámico de teoremas Lean de proyectos reales en GitHub. ¿Qué tan bien rinden la IA y los demostradores especializados?
Aprende cómo la Cristalización de Memoria Adaptativa (AMC) permite a agentes IA adquirir nuevas habilidades sin olvido, mejorando rendimiento y memoria.
Descubre cómo las variables canónicas en el espacio métrico de Wasserstein mejoran la clasificación de distribuciones mediante la maximización de la razón de