#aprendizaje profundo

Pipeline de dos etapas para clasificación detallada de vehículos con Vision Transformers

Nuevo pipeline de dos etapas con Vision Transformers logra 94% de precisión en clasificación de vehículos para seguridad ciclista. Código abierto disponible.

2026-06-04 · 4 min

Personalizando los sesgos inductivos de la atención softmax con matrices estructuradas

Nuevas funciones de scoring con matrices estructuradas de alto rango mejoran la atención softmax. Ideal para modelos de lenguaje y series temporales.

2026-06-04 · 2 min

RAVQ-HoloNet: Compresión Adaptativa de Hologramas con Cuantización Vectorial

Descubre RAVQ-HoloNet, método de compresión holográfica que reduce hasta 33% la tasa de bits y mejora calidad. Ideal para AR/VR de alta fidelidad.

2026-06-04 · 1 min

Las características de agregación fija pueden rivalizar con las GNN

Las FAFs convierten el aprendizaje en grafos en problemas tabulares, rivalizando con las GNNs sin entrenamiento. Mayor interpretabilidad.

2026-06-04 · 2 min

Aprendizaje funcional profundo bayesiano disperso y selección de regiones

sBayFDNN: modelo bayesiano profundo que selecciona regiones funcionales con incertidumbre cuantificada para predicciones en ECG, neuroimagen y wearables.

2026-06-04 · 2 min

Codificador/Decodificador que Preserva Geometría en Modelos Generativos Latentes

Descubre cómo un nuevo framework de codificador/decodificador preserva la geometría de los datos, acelerando la convergencia en modelos generativos latentes.

2026-06-04 · 2 min

Transcriptómica espacial como imágenes para preentrenamiento a gran escala

Descubre cómo tratar la transcriptómica espacial como imágenes permite preentrenar modelos masivos, mejorando el rendimiento en estudios clínicos y patológicos.

2026-06-04 · 3 min

Inferencia bayesiana de difusiones con flujos normalizantes Neural Galerkin

Aprende cómo los flujos normalizantes Neural Galerkin permiten inferencia bayesiana eficiente en difusiones con fronteras inaccesibles.

2026-06-04 · 2 min

MeshTok: Tokenización Multiescala Eficiente para PDE Transformers

Descubre cómo MeshTok optimiza la tokenización multiescala para Transformers de PDE, mejorando el equilibrio de eficiencia y precisión en simulaciones.

2026-06-04 · 2 min

Reducción simpléctica de modelos mediante autoencoders simplécticos

Descubre cómo los autoencoders simplécticos preservan la estructura de sistemas Hamiltonianos, mejorando la precisión en predicciones a largo plazo.

2026-06-04 · 2 min

Escalado de cómputo en tiempo de prueba para ASR con Transformers en bucle

Optimiza el reconocimiento de voz con LARM: un Transformer en bucle que escala el cómputo en tiempo de prueba, mejorando la tasa de error de palabras.

2026-06-04 · 1 min

Más allá de simetrías: conectividad lineal vía identificabilidad neuronal

Descubre cómo la identificabilidad de neuronas permite fusionar representaciones sin alineación previa, revelando nuevas conexiones en el deep learning.

2026-06-04 · 2 min

Cuantificación multi-dominio y cola larga: alineación y escalado

Descubre EmaQ y EmaQ-LT: cuantificación precisa para redes neuronales con dominios múltiples y desbalance, mejorando la eficiencia en dispositivos limitados.

2026-06-04 · 2 min

De Ticks a Flujos: Aprendizaje por Refuerzo en Entornos Continuos

Nuevo marco teórico para aprendizaje por refuerzo en entornos continuos: procesos estocásticos y ecuaciones diferenciales. Mejora tu comprensión de RL.

2026-06-04 · 4 min

BBOmix: Benchmark para optimización de hiperparámetros en representación biológica no supervisada

Descubre BBOmix, el primer benchmark abierto para optimizar hiperparámetros en representación biológica no supervisada con 105,000 evaluaciones en datos multi-ómicos reales.

2026-06-04 · 2 min

Caracterización multigranular de lesiones renales en 3D a partir de TC

Descubre cómo LesionDETR, un modelo DETR modificado, logra caracterizar lesiones renales en 3D con precisión por lesión, mejorando la generación de informes radiológicos estructurados.

2026-06-04 · 2 min

Alineación de Atención Enmascarada para Cuantización Sin Datos en ViTs

Descubre cómo MaskAQ utiliza alineación de atención enmascarada para cuantizar Vision Transformers sin datos reales, mejorando la seguridad y el rendimiento.

2026-06-04 · 2 min