#entrenamiento

Autoinvestigación en dos niveles: meta-investigación de sí mismo

Un marco bilevel de autoinvestigación mejora 5x el preentrenamiento de GPT, optimizando su búsqueda sin intervención humana.

2026-06-04 · 3 min

SSSD: Decodificación Especulativa Simple y Escalable

Descubre SSSD, un método gratuito que acelera la inferencia de LLM hasta 2.9x sin necesidad de entrenamiento ni modelos auxiliares. Robusto en cambios de idioma y contexto largo.

2026-06-04 · 2 min

SSSD: Decodificación Especulativa Simplemente Escalable

Descubre SSSD, un método de decodificación especulativa sin entrenamiento que acelera la inferencia de LLMs hasta 2.9x con menor latencia y alta robustez.

2026-06-04 · 2 min

Pensamiento Especulativo: grandes modelos mejoran el razonamiento

Mejora la precisión de modelos pequeños hasta un 6.2% usando guía de modelos grandes sin entrenamiento. Descubre Speculative Thinking.

2026-06-04 · 2 min

SoLoPO: Optimización de Preferencias de Corto a Largo en LLMs

Descubre cómo SoLoPO mejora la capacidad de los LLMs para manejar contextos largos mediante optimización de preferencias de corto a largo, logrando mayor eficiencia y precisión.

2026-06-04 · 3 min

Pensamiento especulativo: guía de modelos grandes para razonamiento en inferencia

El pensamiento especulativo guía modelos pequeños con modelos grandes, mejorando precisión un 6.2% y reduciendo salida un 15.7%.

2026-06-04 · 2 min

Redondeo Adaptativo que Preserva el Modelo

Descubre YAQA, el algoritmo de redondeo adaptativo que reduce el error de cuantización un 30% sin sobrecarga. Preserva la distribución del modelo original.

2026-06-04 · 1 min

MesaNet: Entrenamiento Localmente Óptimo en Tiempo de Prueba

MesaNet optimiza el entrenamiento en tiempo de prueba para mejorar el rendimiento en secuencias largas. Menor perplejidad y mayor eficiencia.

2026-06-04 · 2 min

MesaNet: Modelado de secuencias con optimización en tiempo de prueba

Descubre MesaNet, un modelo recurrente que optimiza capa por capa en inferencia. Mejora rendimiento en contextos largos sin aumento lineal de memoria.

2026-06-04 · 2 min

YOTO: selección diferenciable de subconjuntos para datos ómicos

Descubre cómo YOTO selecciona subconjuntos óptimos de genes con un solo entrenamiento, mejorando la predicción y la interpretabilidad en datos ómicos.

2026-06-04 · 3 min

Mid-Think: Razonamiento Intermedio sin Entrenamiento via Disparadores de Token

Descubre Mid-Think, un método sin entrenamiento que mejora el equilibrio precisión-longitud en modelos de razonamiento híbrido usando tokens disparadores. Ideal

2026-06-04 · 1 min

BHyT: Alternativa estable y eficiente a Pre-LN en LLMs

BHyT: una alternativa estable y eficiente a Pre-LN en LLMs. Logra 1.6% más rápido entrenamiento y 1.77% más throughput. Rendimiento superior.

2026-06-04 · 2 min

UltraEP: Balanceo de Carga Óptimo para MoE en Nodos a Escala de Rack

Descubre UltraEP, el primer balanceador de carga en tiempo real para MoE que logra un 94.3% del rendimiento ideal en entrenamiento e inferencia con 2560 GPUs.

2026-06-04 · 3 min

Modelos de difusión sin entrenamiento para una sola imagen

Generación de imágenes de alta calidad sin entrenamiento con modelos de difusión basados en parches. Logra resultados de vanguardia en segundos para megapíxeles y minutos para gigapíxeles.

2026-06-04 · 3 min

MusaCoder: generación nativa de kernels GPU con entrenamiento full-stack

Descubre MusaCoder, un marco de entrenamiento full-stack para generar kernels GPU nativos. Combina síntesis de datos, ajuste por rechazo y aprendizaje por refue

2026-06-04 · 2 min

Codificador/Decodificador que Preserva Geometría en Modelos Generativos Latentes

Descubre cómo un nuevo framework de codificador/decodificador preserva la geometría de los datos, acelerando la convergencia en modelos generativos latentes.

2026-06-04 · 2 min

¿Pueden los LLMs generalizar procedimientos entre representaciones?

Descubre cómo un currículo de RL permite a LLMs generalizar procedimientos entre código y lenguaje natural, igualando a GPT-4o.

2026-06-04 · 1 min

Entrenamiento condicionado por camino para reescalar redes ReLU

Descubre cómo entrenamiento condicionado por camino reescala redes ReLU para acelerar aprendizaje. Enfoque geométrico optimiza kernels y mejora inicialización.

2026-06-04 · 2 min

Pocos tokens, gran apalancamiento: preservando la alineación de seguridad durante el ajuste fino

Preserva la alineación de seguridad de tus LLMs durante el fine-tuning con PACT: restricciones focalizadas en tokens de seguridad que evitan la deriva sin sacrificar rendimiento.

2026-06-04 · 2 min

Transcriptómica espacial como imágenes para preentrenamiento a gran escala

Descubre cómo tratar la transcriptómica espacial como imágenes permite preentrenar modelos masivos, mejorando el rendimiento en estudios clínicos y patológicos.

2026-06-04 · 3 min