#imágenes

CoralBay: modelo base de TC con auto-supervisión

Descubre CoralBay, modelo auto-supervisado para TC que aprende representaciones 3D. Mejora el diagnóstico radiológico con un nuevo benchmark.

2026-06-03 · 1 min

Análisis de supervivencia con Graph Mamba y ordenación topológica

Descubre cómo TopoMamSurv supera las limitaciones de Mamba en análisis de supervivencia con ordenación topológica y modelado bidireccional.

2026-06-03 · 2 min

PhotoCraft: Razonamiento Agentivo con Memoria Jerárquica para Búsqueda Visual

Descubre PhotoCraft, un sistema de memoria jerárquica que potencia la búsqueda de imágenes con razonamiento agentivo, logrando mejoras de 18.5% en precisión.

2026-06-03 · 2 min

GuidedBridge: Mejora de modelos puente sin entrenamiento con guía previa

Prior Guidance (PG) y FMPG: mejora modelos puente de traducción de imágenes sin entrenamiento, usando guía previa y modulación de frecuencias. Ideal para inpainting.

2026-06-03 · 2 min

Deriva Generativa y Score Matching: Perspectiva Espectral y Variacional

El Drifting Generativo no es magia: es Score Matching. Aprende su teoría, la elección de kernels, y cómo estabilizar el entrenamiento con el operador stop-gradient.

2026-06-03 · 3 min

Ptychografía ciega a la posición: viabilidad con inferencia variacional

Descubre cómo la inferencia variacional con modelos de difusión permite reconstruir imágenes en ptychografía ciega a la posición, incluso con ruido. Resultados prometedores.

2026-06-03 · 3 min

Colapso de caminos generativos: criterio y corrección para difusión

El colapso de caminos marginales afecta la composición de expertos en difusión. Conoce el criterio de existencia y la corrección ACE para estabilizar la generación.

2026-06-03 · 2 min

Revisión y evaluación de avances en inteligencia 3D multimodal

Descubre los últimos avances y métodos en inteligencia 3D multimodal. Revisión exhaustiva de benchmarks y desafíos clave para la conducción autónoma y simulación.

2026-06-03 · 2 min

Atención por capas eficiente: poda de recuperaciones redundantes

Descubre cómo ELA, usando divergencia KL y mapeo cuantil beta, reduce un 30% el tiempo de entrenamiento al podar capas redundantes en atención por capas.

2026-06-03 · 2 min

Benchmark de Stable Diffusion 1.5 en iPhone local: generaciones increíblemente rápidas

Ejecuta Stable Diffusion 1.5 localmente en tu iPhone. Benchmark con modelos CyberRealistic, DreamShaper y Realistic Vision. Generaciones ultrarrápidas en segundos.

2026-06-03 · 2 min

Red ligera contextual sin entrenamiento para texto en escenas

Descubre cómo una red ligera y sin entrenamiento logra segmentar y reconocer texto en escenas con alta eficiencia, reduciendo costos computacionales y manteniendo precisión.

2026-06-02 · 1 min

DetailMaster: ¿Puede tu modelo texto-imagen manejar prompts largos?

Descubre DetailMaster, el nuevo benchmark para evaluar modelos de texto a imagen con prompts de hasta 284 tokens. ¿Tu modelo lo logra? Entérate.

2026-06-02 · 2 min

C-GSPN: Nuevo codificador de visión a escala fundacional

C-GSPN: codificador de visión que iguala a ViT con 15% menos parámetros, mejora segmentación +2.1% y ofrece 4x de aceleración. ¡Conócelo!

2026-06-02 · 3 min

Difusión composicional de grueso a fino para planificación a largo plazo

CoFi mejora la planificación a largo plazo con difusión composicional. Hasta 8 veces menos evaluaciones. Ideal para robótica, video e imágenes.

2026-06-02 · 1 min

KG-FairDiff: refinamiento de prompts para generación de imágenes justas

KG-FairDiff reduce sesgos demográficos en generación de imágenes vía refinamiento de prompts con grafos de conocimiento. Sin reentrenamiento, mejora equidad.

2026-06-02 · 2 min

PaCX-MAE: Fusión de rayos X y fisiología en IA médica

PaCX-MAE mejora el diagnóstico de rayos X integrando datos fisiológicos (ECG, laboratorio) sin requerirlos en inferencia. Logra +2.7 AUROC y +6.5 F1 con solo 1% de datos.

2026-06-02 · 2 min

Meta-aprendizaje bayesiano para modelar la progresión del Alzheimer

Descubre cómo el meta-aprendizaje bayesiano permite predecir la progresión del Alzheimer de forma personalizada, mejorando el pronóstico a largo plazo sin reentrenamiento.

2026-06-02 · 2 min

Deep Learning para mejorar el mapeo de inundaciones por satélite

Descubre cómo el Deep Learning y los modelos de difusión eliminan nubes en imágenes satelitales para mejorar el mapeo de inundaciones y la gestión de desastres.

2026-06-02 · 1 min

DPsurv: Fusión evidencial de doble prototipo para predicción de supervivencia

DPsurv utiliza fusión evidencial de doble prototipo para predecir supervivencia en imágenes patológicas, ofreciendo interpretabilidad y medición de incertidumbr

2026-06-02 · 3 min

Semimage: Codificación semántica HSV para representación de texto

Descubre Semimage, un método innovador que convierte texto en imágenes HSV para clasificación con CNNs. Mejora la interpretabilidad y precisión en análisis de documentos.

2026-06-02 · 2 min