#mos · DeepCodeNews

MAF: Prompting Adaptativo Multimodal para Análisis de Sentimientos

Mejora el análisis de sentimientos con MAF: marco adaptativo multimodal que recupera demostraciones relevantes y fusiona similitudes para mayor precisión en

2026-06-16 · 1 min

Red-Teaming en Contextos de Ejecución de Agentes: Evaluación de Seguridad en OpenClaw

Descubre cómo DeepTrap expone vulnerabilidades contextuales en agentes de IA, yendo más allá de los prompts de usuario.

2026-06-16 · 2 min

Benchmarking de ruido de etiquetas con corrupciones controladas

Descubre CILN, un nuevo marco para generar ruido de etiquetas realista y controlable. Evalúa el impacto de corrupciones controladas en algoritmos de

2026-06-16 · 2 min

Curación por fases no mejora filtrado de demostraciones

Un estudio revela que seleccionar métricas por fase no mejora la curación de demostraciones robóticas. Las métricas globales únicas son más efectivas. Descubre

2026-06-16 · 1 min

NVMOS: Evaluación de calidad de vocalizaciones no verbales en el habla

NVMOS: el primer modelo que predice la calidad perceptual de vocalizaciones no verbales como risas y suspiros. Supera a expertos.

2026-06-16 · 2 min

NASA rechaza plan ruso de cortar segmento con fugas en la ISS

NASA ordenó refugio en Dragon ante plan ruso de cortar un segmento con fugas en la ISS. Descubre los riesgos y posibles soluciones.

2026-06-16 · 2 min

GAS-Leak-LLM: Jailbreaking con Algoritmos Genéticos en Caja Negra

GAS-Leak-LLM usa algoritmos genéticos para crear sufijos adversariales y eludir la seguridad de los LLM en caja negra. Estudio revela vulnerabilidades.

2026-06-16 · 1 min

NVMOS: Evaluación de calidad de vocalizaciones no verbales en el habla

NVMOS es el primer modelo que mide la calidad perceptiva de vocalizaciones no verbales (risas, suspiros, tos) superando a modelos multimodales. Descubre su

2026-06-16 · 2 min

ControlMap: generación controlable de mapas HD para simulación de tráfico

Descubre cómo ControlMap genera mapas HD realistas siguiendo topologías de carreteras específicas con control espacial y transferencia de estilo urbano.

2026-06-16 · 3 min

Open-SWE-Traces: destilación dual multilingüe para agentes de software

Descubre Open-SWE-Traces, 207K trayectorias para agentes de software. Logra 61.7% en SWE-bench Verified. Infórmate!

2026-06-16 · 1 min

Deep learning para reconocer objetos y posición de cargas en logística autónoma

Red neuronal profunda detecta portadores de carga y estima su pose usando visión RGBD para logística autónoma.

2026-06-16 · 2 min

Contratos de seguro anti-manipulación para agentes IA autónomos

Descubre cómo diseñar contratos de seguro para agentes IA autónomos resistentes a manipulación estratégica. Un mecanismo de peaje innovador que garantiza

2026-06-16 · 2 min

ATOM-Bench: benchmark para habilidades atómicas y generalización composicional

Descubre ATOM-Bench: benchmark para evaluar habilidades atómicas y generalización composicional en robótica. Conoce los resultados clave.

2026-06-16 · 2 min

Benchmark para segmentación federada de imágenes médicas con ruido real

¿Cansado del ruido sintético? Conoce nuestro benchmark realista para segmentación federada con ruido real en etiquetas. Elige el mejor método FNLL.

2026-06-16 · 2 min

Razonamiento matemático avanzado para LLMs con lógica de primer orden

DREAM mejora el razonamiento matemático de LLMs mediante lógica de primer orden, logrando hasta un 6.4% de mejora.

2026-06-16 · 1 min

AIQI: La Primera IA Universal sin Modelo

Descubre AIQI, el primer agente de IA universal sin modelo que logra optimalidad asintótica en aprendizaje por refuerzo general. Un avance revolucionario.

2026-06-16 · 2 min

SorryDB: ¿Puede la IA demostrar teoremas Lean reales?

Descubre SorryDB, el benchmark dinámico que evalúa la capacidad de la IA para demostrar teoremas reales de Lean. ¿Qué tan avanzados están los demostradores

2026-06-16 · 2 min

SorryDB: ¿Pueden los demostradores de IA resolver teoremas Lean reales?

Descubre SorryDB, un benchmark dinámico de teoremas Lean de proyectos reales en GitHub. ¿Qué tan bien rinden la IA y los demostradores especializados?

2026-06-16 · 1 min

Cristalización de Memoria Adaptativa en Agentes IA

Aprende cómo la Cristalización de Memoria Adaptativa (AMC) permite a agentes IA adquirir nuevas habilidades sin olvido, mejorando rendimiento y memoria.

2026-06-16 · 2 min

Variables Canónicas en el Espacio Métrico de Wasserstein

Descubre cómo las variables canónicas en el espacio métrico de Wasserstein mejoran la clasificación de distribuciones mediante la maximización de la razón de

2026-06-16 · 2 min