Más allá de pares de código: diálogos para traducción de LLM
Mejora la traducción de código con un pipeline que genera diálogos y traducciones verificadas usando dos LLM. Resultados sorprendentes en Fortran y CUDA.
Mejora la traducción de código con un pipeline que genera diálogos y traducciones verificadas usando dos LLM. Resultados sorprendentes en Fortran y CUDA.
NVIDIA Dynamo Snapshot reduce el cold start de modelos de IA en Kubernetes hasta 21x. Checkpoint/restore con CRIU y CUDA para escalado elástico rápido.
CuTeGen usa agentes de IA para generar y optimizar kernels GPU de alto rendimiento. Logra un 71% más de velocidad que PyTorch en pruebas estándar. ¡Descubre este framework innovador!
Acelera LLMs distribuidos hasta 1.57x con CUCo, marco agéntico que codiseña kernels CUDA automáticamente, con costos inferiores a $10.
C-GSPN: codificador de visión que iguala a ViT con 15% menos parámetros, mejora segmentación +2.1% y ofrece 4x de aceleración. ¡Conócelo!
Con HASTE, el entrenamiento disperso dinámico consciente del hardware logra hasta 25x de aceleración en backpropagation para clasificación multi-etiqueta extrema.
MiniMax lanza M3 con arquitectura MSA, contexto de 1M de tokens y multimodalidad nativa. Supera a GPT-5.5 en SWE-Bench Pro. API ya disponible.
Descubre el gap de inferencia en IA física: memoria limitada pero no ancho de banda. CUDA Graphs muestra un overhead oculto en GPUs rápidas como H100.
CA-AC-MPC: control predictivo basado en actor-crítico acelerado por CUDA para optimización en tiempo real de sistemas de control.