#reentrenamiento

Desaprendizaje rápido a gran escala vía autocorrección de margen

MASC ofrece desaprendizaje rápido a gran escala para modelos de lenguaje, sin reentrenamiento. Mejora la eficiencia y preserva la utilidad. ¡Conoce el método!

2026-06-03 · 3 min

Speedrun de preentrenamiento de modelos tabulares

Descubre cómo el speedrun de nanoTabPFN logró un speedup de 81x en preentrenamiento de modelos tabulares. Participa y contribuye al benchmark abierto en GitHub.

2026-06-03 · 3 min

Preentrenamiento de modelos de lenguaje en textos históricos

Descubre TypewriterLM, un modelo de lenguaje de 7.24B parámetros entrenado con textos anteriores a 1913. Supera desafíos de calidad y fuga temporal.

2026-06-03 · 2 min

MUSE: Un arnés agéntico unificado para MLLMs

Potencia MLLMs con MUSE, un arnés agéntico unificado que mejora tareas complejas sin reentrenar, usando verificación y reparación guiada.

2026-06-03 · 3 min

Evaluación Causal de Ataques de Inferencia de Membresía

Descubre un nuevo enfoque causal para evaluar ataques de inferencia de membresía sin reentrenar, reduciendo sesgos. ¡Ideal para LLMs!

2026-06-03 · 2 min

Cómo el escalamiento en inferencia beneficia el preentrenamiento generativo

El escalamiento en inferencia mejora el preentrenamiento generativo, superando la falsa dicotomía entre autoregresión y difusión.

2026-06-03 · 1 min

Ley de escalado de datos para meta-aprendizaje con minimización de complejidad

Descubre cómo la minimización de complejidad demuestra que el meta-aprendizaje escala con datos, mejorando la eficiencia en pocos ejemplos.

2026-06-02 · 2 min

Descenso Espejo Bajo Suavidad Generalizada

Descubre cómo el descenso espejo se adapta a suavidad generalizada para optimizar objetivos no suaves, con aplicaciones en entrenamiento de LLMs. ¡Conoce las nuevas garantías de convergencia!

2026-06-02 · 2 min

Reconstruir contenido con atención colaborativa mejora embeddings multimodales

Mejora la calidad de embeddings multimodales con atención colaborativa y reconstrucción de contenido para tareas de recuperación y clasificación.

2026-06-02 · 2 min

BLISS: Método ligero de influencia bilevel para selección de datos

BLISS: método ligero para selección de datos en preentrenamiento de LLMs. Logra 1.7x de aceleración sin modelos externos.

2026-06-02 · 2 min

Aprendizaje robusto de neurona DRO grupal

Algoritmo eficiente para aprendizaje robusto de neuronas con DRO grupal, tolerante a ruido y cambios de distribución. Ideal para preentrenamiento de LLMs.

2026-06-02 · 2 min

SurrogateSHAP: Atribución de contribuyentes sin reentrenamiento para modelos T2I

Aprende cómo SurrogateSHAP atribuye contribuyentes en modelos T2I sin reentrenamiento, reduciendo costos y mejorando transparencia.

2026-06-02 · 2 min