#segmentación semántica

Segmentación 2D-U-Net multiplano de órganos abdominales con mapas de ocurrencia

Segmentación abdominal con 2D-U-Net multiplanar y mapas de ocurrencia espacial mejora precisión en CT 3D. Modelo ligero y eficiente.

2026-06-16 · 2 min

GVC-Seg: Segmentación 3D sin entrenamiento por correspondencia visual-geométrica

GVC-Seg segmenta instancias 3D sin entrenamiento, elimina sesgo de confianza usando correspondencia geométrico-visual. Resultados de vanguardia.

2026-06-16 · 2 min

Evidencia de textura en SAM: características, propuestas y segmentación

¿El modelo SAM es ciego a las texturas? Revelamos dónde reside la evidencia y cómo interpretar sus fallos. Lectura esencial para investigadores en IA.

2026-06-16 · 2 min

ActiveSAM: poda condicional de clases para segmentación rápida

ActiveSAM acelera la segmentación de vocabulario abierto hasta 5.5x sin entrenamiento, superando a SegEarth-OV3 en precisión y robustez. Ideal para entornos

2026-06-16 · 2 min

SLUM-i: Aprendizaje semisupervisado para mapeo de asentamientos informales

SLUM-i: aprendizaje semisupervisado para mapeo de asentamientos informales con mejora en calidad de datos. Logra +5.9 pp mIoU.

2026-06-16 · 3 min

CLARITY: Segmentación de escenas de conducción con guía lingüística RGB-T

Descubre CLARITY, un framework de fusión RGB-T adaptativa guiado por lenguaje visual, que logra SOTA en segmentación de escenas de conducción (62.3% mIoU).

2026-06-16 · 2 min

NEST3D: Dataset multimodal de alta resolución de nidos de tejedores sociables

Descubre el dataset NEST3D: 1.4 TB de imágenes RGB y multiespectrales de nidos de tejedores sociables. Ideal para segmentación 3D y conservación de aves.

2026-06-15 · 2 min

Adaptadores de profundidad para codificadores RGB con preprocesamiento sinusoidal

Descubre cómo los adaptadores de profundidad con preprocesamiento sinusoidal mejoran la precisión en tareas RGBD, alcanzando 56.05 mIoU en SUN-RGBD. Sin necesidad de ajuste fino.

2026-06-15 · 2 min

Aprendiendo qué predecir: diseño de tareas guiado por rendimiento final

Descubre cómo V-pretraining mejora capacidades objetivo usando pocos ejemplos finales como feedback, sin degradar la generalización. Ideal para modelos de lenguaje y visión.

2026-06-15 · 3 min

LASA: Segmentación semántica débil de bocetos con vocabulario abierto

Descubre LASA, un método de supervisión débil que segmenta bocetos con vocabulario abierto usando atención multi-capa. Mejora mIoU hasta +15.7. ¡Lee más!

2026-06-11 · 2 min

Equilibrio de datos reales y sintéticos para detección de grietas en mampostería con CNN

Descubre cómo combinar datos sintéticos con solo un 20% de datos reales iguala y mejora la detección de grietas en mampostería con CNN. ¡Resultados sorprendentes!

2026-06-09 · 2 min

Marginalización de fase en Vision Transformers: inestabilidad de cuadrícula

Mejora la segmentación y profundidad con marginalización de fase en Vision Transformers. Sin entrenamiento, más precisión.

2026-06-09 · 2 min

I-Segmenter: Transformador de Visión de Enteros para Segmentación Semántica

I-Segmenter: segmentación semántica eficiente con transformador de visión solo enteros, reduce tamaño 3.8x, acelera inferencia. Para dispositivos limitados.

2026-06-09 · 3 min

PolyBuild: Extracción de contornos de edificios en imágenes satelitales

Descubre PolyBuild, un método innovador que extrae directamente contornos de edificios en imágenes satelitales sin post-procesamiento. ¡Resultados superiores!

2026-06-09 · 2 min

Mejora de MedSAM con predictor de cajas ligero para segmentación médica

Aumenta la precisión de segmentación médica con predictor de cajas ligero integrado en MedSAM. Resultados: Dice 0.89-0.98 en múltiples modalidades.

2026-06-04 · 3 min

PRISM: Integración de Modelos de Visión con Expertos Autoorganizados

PRISM combina modelos de visión fundacionales con expertos autoorganizados, superando la transferencia negativa para lograr el estado del arte en segmentación.

2026-06-03 · 1 min

Percepción autónoma compacta con aprendizaje balanceado y fusión multisensor

Un modelo compacto de percepción autónoma que integra múltiples sensores y aprendizaje balanceado para lograr mayor eficiencia y velocidad de inferencia.

2026-06-03 · 2 min

FedS2R: Generalización Federada One-Shot para Segmentación en Conducción Autónoma

Descubre FedS2R, el primer marco de generalización federada one-shot para segmentación semántica sintética-real en conducción autónoma, con mejoras en Cityscapes, BDD100K, Mapillary, IDD y ACDC.

2026-06-02 · 2 min