Estimación de profundidad y pose monocular auto-supervisada para endoscopia
Descubre cómo la auto-supervisión con priores latentes mejora la precisión en profundidad y pose para endoscopia, superando desafíos de iluminación y texturas.
Descubre cómo la auto-supervisión con priores latentes mejora la precisión en profundidad y pose para endoscopia, superando desafíos de iluminación y texturas.
Descubre cómo las cámaras de eventos permiten la reconstrucción 3D en condiciones extremas. Encuesta completa de técnicas, datasets y desafíos.
Descubre por qué la percepción visual supera al razonamiento en preguntas de video. Análisis del modelo Perception First para el desafío VRR 2026.
Un enfoque algebraico unifica resultados contradictorios sobre la expresividad de modelos recurrentes: desde autómatas finitos hasta completitud de Turing.
Un nuevo marco de atribución monosemántica estabiliza explicaciones en modelos de lenguaje para diagnósticos de Alzheimer, mejorando la confianza.
Nuevo método SAMN elimina hiperparámetros en reescalado adaptativo monótono para colas largas. Resultados SOTA en benchmarks.
GeoSAM-3D segmenta objetos en 3D desde un video monocular con un clic. Usa propagación geodésica sobre Gaussian Splatting para precisión en superficies curvas. ¡Descúbrelo!
Descubre cómo el Proceso de Inserción (IP) aprende qué insertar, dónde y cuándo terminar, superando modelos de grid fijo. Ideal para planificación y generación molecular.
SkyShield es el primer benchmark de ocupación semántica front-view para drones a baja altitud. Mejora la seguridad con métricas dinámicas y alcanzabilidad.
Aprende a estructurar un monorepo TypeScript con subproyectos, esquemas compartidos y validación. Consigue tipado seguro entre frontend y backend sin herramientas pesadas.
Descubre cómo la Teoría del Átomo define las unidades fundamentales de los LLM, logrando un 99.9% de fidelidad y 99.8% de estabilidad.
Aprende a usar el hedging en la frontera para aprender nuevas tareas con pocos ejemplos. Mejora la transferencia y selección de modelos con monotonicidad débil.
Mejores predicciones no siempre dan mejores resultados en subastas de auto-ofertas. Analizamos monotonicidad en ingresos y bienestar según formato.
Nuevas arquitecturas functoriales basadas en HITs logran generalización composicional superior, con mejoras de hasta 10x y reducción del 46% de error.
Descubre MIMO, un marco innovador que mejora la búsqueda multilingüe usando objetivos monolingües. Supera modelos actuales, optimizando alineación y uniformidad.