#mos · DeepCodeNews

Mecanismos de fidelidad pronominal en LLMs

Descubre cómo los modelos de lenguaje procesan los pronombres: tres mecanismos en competencia explican hasta el 99.5% de su comportamiento.

2026-06-16 · 3 min

Incentivos y evidencia en la orquestación de servicios aprendida

Analizamos por qué los sistemas de orquestación con RL no llegan a producción: sesgos, incentivos y necesidad de evidencia operativa.

2026-06-16 · 3 min

DemoDiffusion: Imitación Humana en un Solo Intento con Política de Difusión

DemoDiffusion: robots imitan movimientos humanos con una sola demostración usando políticas de difusión preentrenadas. ¡83.8% de eficacia!

2026-06-16 · 2 min

Optimizando cruces globales y locales en grafos con RL

Descubre cómo el aprendizaje por refuerzo reduce cruces en grafos. Comparamos RL con heurísticas clásicas para minimizar cruces globales y locales.

2026-06-16 · 2 min

CT-VDETR: Detección semisupervisada de traumatismos 3D en TC

Descubre CT-VDETR, un método semisupervisado que detecta traumatismos abdominales en TC 3D con solo 78 anotaciones, mejorando el rendimiento un 53%.

2026-06-16 · 2 min

Aprendizaje multiescala óptimo de operadores lineales

Descubre el aprendizaje multiescala óptimo: estimación de operadores lineales con tasas minimax y coste adaptativo.

2026-06-16 · 3 min

Magnitude emerge del sigilo con $10 millones en financiación

Magnitude emerge del sigilo con $10M para revolucionar la gestión de riesgos de terceros mediante agentes de IA autónomos. Descubre cómo.

2026-06-16 · 1 min

Identificación del Mejor Brazo con Arrepentimiento Mínimo

Descubre cómo el algoritmo Double KL-UCB identifica el mejor brazo minimizando el arrepentimiento acumulado. Un avance clave en bandidos multimodales con

2026-06-16 · 2 min

Entrenamiento distribuido eficiente para óptimos planos en deep learning

Descubre cómo el método DPPF permite entrenar modelos con menos comunicación y mejor generalización, encontrando mínimos planos de forma colaborativa.

2026-06-16 · 2 min

Beneficios de la normalización de pesos en sensado matricial sobreparametrizado

Descubre cómo la normalización de pesos acelera exponencialmente la convergencia en detección de matrices sobreparametrizadas. Un avance teórico clave.

2026-06-16 · 2 min

Convergencia en tiempo finito del Q-learning robusto distribucional

Descubre cómo el Q-learning robusto con aproximación lineal converge en tiempo finito bajo incertidumbre chi-cuadrado, usando solo trayectorias markovianas.

2026-06-16 · 1 min

XMedFusion: Percepción y razonamiento multimodal guiado por conocimiento

Descubre XMedFusion, un marco de IA que integra percepción visual y razonamiento guiado para informes radiológicos precisos.

2026-06-16 · 2 min

Grafos conectómicos del cerebro controlan locomoción en moscas

Aprende cómo el mapa completo de conexiones cerebrales de una mosca permite controlar sus movimientos con IA, abriendo camino a robots más naturales.

2026-06-16 · 2 min

Recupera, no reentrenes: extiende modelos VLA a nuevas tareas en prueba

Extiende modelos VLA a nuevas tareas sin reentrenar, solo recuperando datos. Ahorra tiempo y recursos con esta técnica en tiempo de prueba.

2026-06-16 · 1 min

PO-PDDL: Aprendizaje de POMDPs simbólicos para planificación bajo incertidumbre

PO-PDDL permite planificación robótica robusta aprendiendo modelos POMDP simbólicos de videos reales bajo incertidumbre.

2026-06-16 · 1 min

MAF: Prompting Adaptativo Multimodal para Análisis de Sentimientos

Mejora el análisis de sentimientos con MAF: marco adaptativo multimodal que recupera demostraciones relevantes y fusiona similitudes para mayor precisión en

2026-06-16 · 1 min

Red-Teaming en Contextos de Ejecución de Agentes: Evaluación de Seguridad en OpenClaw

Descubre cómo DeepTrap expone vulnerabilidades contextuales en agentes de IA, yendo más allá de los prompts de usuario.

2026-06-16 · 2 min

Benchmarking de ruido de etiquetas con corrupciones controladas

Descubre CILN, un nuevo marco para generar ruido de etiquetas realista y controlable. Evalúa el impacto de corrupciones controladas en algoritmos de

2026-06-16 · 2 min

Curación por fases no mejora filtrado de demostraciones

Un estudio revela que seleccionar métricas por fase no mejora la curación de demostraciones robóticas. Las métricas globales únicas son más efectivas. Descubre

2026-06-16 · 1 min

NVMOS: Evaluación de calidad de vocalizaciones no verbales en el habla

NVMOS: el primer modelo que predice la calidad perceptual de vocalizaciones no verbales como risas y suspiros. Supera a expertos.

2026-06-16 · 2 min