#ode · DeepCodeNews

Decodificando la intención de cruce peatonal con modelos de visión y lenguaje

Investigación que utiliza modelos de lenguaje y visión para predecir intención de cruce peatonal desde vídeos egocéntricos, con un 14.5% más de precisión.

2026-06-16 · 2 min

SEF-CLGC en SemEval-2026: Impacto de la Notación Lógica en Modelos de Lenguaje

Descubre cómo SEF-CLGC combina notación lógica y SLMs para evaluar razonamiento en IA, reduciendo sesgo y logrando 27.80% de contenido.

2026-06-16 · 2 min

Uni-E: Decodificación Invariante e Independiente en Modelos de Difusión

Descubre Uni-E, una energía unificada para decodificación invariante e independiente en modelos de difusión. Corrige desviaciones.

2026-06-16 · 3 min

Red-Teaming culturalmente adaptado: análisis comparativo en Asia

La traducción directa subestima riesgos en LLMs. Este análisis en 4 idiomas asiáticos muestra cómo el red-teaming culturalmente adaptado revela amenazas reales.

2026-06-16 · 2 min

Preentrenados y congelados: fuga de atributos en modelos EEG

Descubre cómo los modelos EEG preentrenados filtran atributos incluso con defensas como DP-SGD. Auditoría cross-encoder revela fugas persistentes. ¡Lee el

2026-06-16 · 2 min

Entrenamiento E2E para sistema TTS basado en tokens discretos y LLM

El nuevo marco E2E unifica tokenizador, LLM y FM, logrando un WER del 0.78% y 1.56% en TTS, superando a los sistemas en cascada.

2026-06-16 · 2 min

EgoTactile: Presión de agarre para objetos cotidianos desde video egocéntrico

EgoTactile: benchmark y difusión condicional para estimar presión de agarre en objetos cotidianos desde video egocéntrico. Aplicaciones en VR y robótica.

2026-06-16 · 2 min

Aprendiendo de residuos de solucionadores para generación crítica

Aprende cómo los residuos de solucionadores y las recompensas aditivas saturadas (SAR) logran que un modelo de 8B compita con sistemas frontera en generación

2026-06-16 · 3 min

Ley geométrica interna: aprender de residuos para generación precisa

Descubre cómo SAR mejora 2.3x la resolución de problemas geométricos de precisión crítica, superando el enmascaramiento de gradientes atípicos.

2026-06-16 · 3 min

Conan-embedding-v3: fusión de modelos para incrustación omni-modal

Conan-embedding-v3 fusiona modelos específicos para recuperación omni-modal, resuelve deriva del proyector, logra récords en MMEB y MAEB.

2026-06-16 · 2 min

Conan-embedding-v3: Fusión de modelos para incrustación omni-modal

Conan-embedding-v3: fusión de especialistas y solución a la deriva del proyector para recuperación omni-modal líder en MMEB y MAEB.

2026-06-16 · 2 min

Definición de buenas explicaciones y retos al explicar LLMs

Descubre cómo definir una buena explicación en IA y por qué es difícil explicar los outputs de los modelos de lenguaje. Clave para la transparencia.

2026-06-16 · 2 min

Modelos Causales Estructurales Relacionales

Modelos causales relacionales para IA: razonamiento sobre intervenciones y generalización a objetos no vistos. Aprende su implementación con redes neuronales.

2026-06-16 · 2 min

Definición de buenas explicaciones y retos al explicar salidas de LLM

Descubre cómo definir una buena explicación según la filosofía y la IA, y por qué es tan difícil explicar los outputs de los LLMs. Aprende sobre explicaciones

2026-06-16 · 1 min

Confianza entre agentes de IA: cómo medirla, perderla y recuperarla

Descubre cómo medir la confianza entre agentes de IA. Estudio revela diferencias en formación, ruptura y recuperación.

2026-06-16 · 2 min

Modelos Causales Relacionales para la Inteligencia Artificial

Los Modelos Causales Estructurales Relacionales amplían la causalidad a objetos y relaciones variables. Aprende cómo se identifican consultas causales y

2026-06-16 · 1 min

Confianza entre agentes de IA: formación, ruptura y recuperación

Aprende a medir la confianza entre agentes de IA, su formación, ruptura y recuperación, y las claves para gobernar sistemas multiagente de manera segura.

2026-06-16 · 2 min

Fusión no es única: Alineación multimodal para modelos de tiempo a evento

Descubre cómo la alineación de CT y datos clínicos mejora la predicción de eventos. Fusión contrastiva logra hasta 5.4% más precisión.

2026-06-16 · 1 min

OSGuard: Benchmark de seguridad para agentes informáticos

Descubre OSGuard, el nuevo benchmark que evalúa la seguridad de los agentes de IA en tareas informáticas. ¿Logran evitar atajos inseguros? Lee más.

2026-06-16 · 2 min

Alineación multimodal para predicción temporal de eventos

Mejora la predicción de eventos clínicos hasta un 5.4% con fusión multimodal adaptativa. Descubre cómo alinear CT y EHR para robustez en distintos escenarios.

2026-06-16 · 2 min