#reentrenamiento

Clonado conductual en anotación científica: un estudio sistemático

El clonado conductual optimiza la anotación de datos, reduce errores y acelera procesos. Estudio revela habilidades emergentes y representaciones internas.

2026-06-09 · 3 min

SlideCheck: guía el preentrenamiento de modelos de patología con distribuciones

Descubre cómo SlideCheck guía el preentrenamiento de modelos de patología con distribuciones de datos para filtrar y auditar parches WSI, mejorando eficiencia y control en el desarrollo de IA.

2026-06-09 · 2 min

Preentrenamiento con datos limitados: regularización mejorada y leyes de escalado

La regularización MIR y la ley SoftQ mejoran el preentrenamiento con datos limitados, equivalente a 1.3 veces más datos.

2026-06-08 · 3 min

GRASP: Alineación Residual Geométrica para Atribución de Datos Escalable

GRASP: nuevo método de atribución de datos que duplica la precisión y reduce costos en entrenamiento de IA.

2026-06-08 · 1 min

GRASP: Alineación Residual Geométrica para Atribución Escalable

Descubre GRASP, un método innovador que modela interacciones entre subconjuntos para optimizar la atribución de datos en preentrenamiento a gran escala. Mejora eficiencia y precisión.

2026-06-08 · 2 min

Modelo fundacional generativo para diseño de polímeros lineales

Descubre PolyConFM, el modelo fundacional que revoluciona el diseño de polímeros lineales usando IA generativa centrada en conformación. Mejora precisión en múltiples tareas.

2026-06-08 · 2 min

Tiempo hasta evento marcado: nuevo objetivo para modelos EHR

Descubre cómo un nuevo objetivo de preentrenamiento que modela el tiempo y valor de eventos clínicos mejora los modelos fundacionales EHR, logrando representaci

2026-06-08 · 2 min

OneReason: Razonamiento en Recomendaciones Generativas

Descubre OneReason, el nuevo enfoque que combina percepción y cognición para activar el razonamiento en modelos de recomendación generativa.

2026-06-06 · 3 min

LatentWave: Preentrenamiento JEPA para modelos base inalámbricos

LatentWave: modelo base inalámbrico con preentrenamiento JEPA. Aprende representaciones latentes transferibles para clasificación, posicionamiento y predicción.

2026-06-06 · 1 min

PC Layer: Preacondicionamiento de Pesos Polinomial para Mejorar el Pre-entrenamiento de LLMs

La capa PC estabiliza el espectro de valores singulares en LLMs, mejorando convergencia sin overhead de inferencia. Optimiza tu pre-entrenamiento.

2026-06-05 · 2 min

IR3DE: Router Lineal para Grandes Modelos de Lenguaje

IR3DE: router lineal que selecciona el mejor modelo experto para cada prompt, logrando 98.4% de rendimiento sin reentrenamiento. Optimiza tus inferencias.

2026-06-05 · 1 min

Predicción contrafactual con redes causales ajustadas por prior

Descubre CausalLongPFN, un modelo preentrenado con datos sintéticos que predice resultados contrafactuales en secuencias temporales sin necesidad de reentrenamiento. Competitivo en benchmarks reales.

2026-06-05 · 2 min

Teoría de alta dimensión del ajuste fino LoRA en atención

Teoría de alta dimensión para ajuste fino LoRA en atención. Descubre cómo el pre-entrenamiento afecta el error de prueba y la alineación. Ideal para optimizar modelos.

2026-06-05 · 2 min

Autoinvestigación en dos niveles: meta-investigación de sí mismo

Un marco bilevel de autoinvestigación mejora 5x el preentrenamiento de GPT, optimizando su búsqueda sin intervención humana.

2026-06-04 · 3 min

Transcriptómica espacial como imágenes para preentrenamiento a gran escala

Descubre cómo tratar la transcriptómica espacial como imágenes permite preentrenar modelos masivos, mejorando el rendimiento en estudios clínicos y patológicos.

2026-06-04 · 3 min

RL en preentrenamiento de LLM: optimización temprana de políticas

Aplicar RL durante el preentrenamiento de LLM mejora rendimiento, superando al enfoque SFT→RL. Fusionar RL y SFT da mejores resultados sin perder capacidades.

2026-06-04 · 2 min

Repensando incompletitud: divergencia de protocolos y aprendizaje único para IMVC

Descubre CRAFT: un entrenamiento único supera la divergencia de protocolos en IMVC. Elimina reentrenamiento y logra robustez en datos faltantes.

2026-06-04 · 2 min

Adaptador de texto para TabPFN sin cuello de botella PCA

Conoce el adaptador de texto para TabPFN que elimina el cuello de botella PCA, mejorando el rendimiento en datos tabulares con texto de alta cardinalidad.

2026-06-04 · 2 min

OpenRFM: Diseccionando el Aprendizaje Relacional en Contexto

OpenRFM mejora un 30% el rendimiento en tareas relacionales. Su arquitectura dual y preentrenamiento inteligente superan a modelos comerciales.

2026-06-04 · 3 min

q0: Primitivas para el preentrenamiento con hiper-épocas

Descubre q0: primitivas para preentrenar con hiper-épocas. Genera una población de modelos diversos que logran menor pérdida de validación con hasta 4.6x menos épocas.

2026-06-03 · 3 min