#imo · DeepCodeNews

CausalMoE: modelo fundacional multimodal para causalidad de Granger

CausalMoE, un modelo multimodal, revoluciona la detección causal de Granger usando expertos heterogéneos y patrones temporales, integrando LLMs y VLMs.

2026-06-12 · 2 min

scLLM-DSC: Agrupamiento Estructural Profundo Multimodal con LLM para scRNA-seq

scLLM-DSC mejora el clustering de scRNA-seq integrando conocimiento de LLM y supera 11 métodos. Conoce este avance en bioinformática.

2026-06-12 · 2 min

CausalMoE: Modelo fundacional multimodal para causalidad Granger

Descubre CausalMoE, el primer modelo fundacional multimodal que integra LLMs y VLMs para descubrimiento causal Granger preciso en series temporales complejas.

2026-06-12 · 2 min

ReFoCUS: Selección de Fotogramas con Refuerzo para Comprensión Contextual

Descubre cómo ReFoCUS utiliza aprendizaje por refuerzo para seleccionar fotogramas clave en video, mejorando la precisión en tareas de comprensión contextual.

2026-06-12 · 2 min

Explicabilidad en modelos multimodales basados en atención: revisión sistemática

Descubre la revisión sistemática sobre explicabilidad en modelos multimodales basados en atención. Recomendaciones para evaluaciones estandarizadas.

2026-06-12 · 3 min

Flujo Equivariante para Problemas de Bifurcación con Ruptura de Simetría

Descubre cómo el flujo equivariante con IA modela bifurcaciones con ruptura de simetría, capturando múltiples soluciones estables en sistemas físicos.

2026-06-12 · 2 min

Generación Autoregresiva Descentralizada

Descubre cómo la generación autoregresiva descentralizada logra equivalencia teórica con el entrenamiento centralizado. Validado en benchmarks multimodales.

2026-06-12 · 2 min

HELVAE: Autoencoders Multimodales con Divergencia Hellinger

Descubre cómo HELVAE mejora los autoencoders multimodales usando la divergencia Hellinger para representaciones latentes más expresivas y mejor equilibrio entre coherencia y calidad.

2026-06-12 · 2 min

FENCE: Dataset bilingüe multimodal para detección de jailbreak en finanzas

Descubre FENCE, el primer dataset bilingüe multimodal para detectar jailbreak en sistemas financieros de IA. Entrena detectores robustos y protege tus modelos.

2026-06-12 · 2 min

CMI-RewardBench: Evaluación de modelos de recompensa musical multimodal

Descubre cómo CMI-RewardBench evalúa modelos de recompensa musical con instrucciones multimodales, mejorando la generación y alineación de música con IA.

2026-06-12 · 2 min

PaLMR: Razonamiento Visual Fiel mediante Alineación Multimodal

PaLMR alinea procesos de razonamiento visual en modelos multimodales, reduciendo alucinaciones y mejorando fidelidad. Logra resultados de vanguardia en HallusionBench, MMMU, MathVista y MathVerse.

2026-06-12 · 1 min

Mayoría de tres: el aprendizaje PAC óptimo

Descubre la votación mayoritaria de tres clasificadores como método óptimo en aprendizaje PAC. Artículo simplifica la teoría y demuestra optimalidad.

2026-06-12 · 1 min

Mezcla rápida para medidas de Gibbs en variedades riemannianas

Descubre cómo la mezcla rápida de Gibbs en variedades riemannianas logra tiempos polinomiales evitando barren plateaus y mínimos espurios.

2026-06-12 · 1 min

Modelado de conceptos enmascarados entre modalidades: MACCO

Descubre MACCO, un innovador marco que mejora la comprensión composicional en modelos visión-lenguaje como CLIP, superando el comportamiento de 'bolsa de palabras'.

2026-06-12 · 1 min

HYDRA-X: Modelo multimodal unificado con tokenizador visual holístico

HYDRA-X unifica tokenización de imágenes y video en un solo ViT. Mejora edición y comprensión multimodal. ¡Descubre cómo!

2026-06-12 · 2 min

Condicionamiento de contexto basado en rareza para detección de anomalías marítimas

Descubre cómo RGFiLM reduce las falsas alarmas en la detección de anomalías marítimas al ajustar el condicionamiento según la rareza del contexto.

2026-06-12 · 2 min

Red Generativa Antagónica de Doble Dominio para Síntesis Multimodal CT-PET

La red DDE-GAN mejora la síntesis de imágenes CT-PET combinando aprendizaje en dominio espacial y frecuencial con equivarianza rotacional para mayor precisión.

2026-06-12 · 1 min