#harp

HARP: Selección eficiente de datos para ajuste fino de modelos de lenguaje grandes

HARP selecciona datos óptimos para ajuste fino de LLMs, reduciendo costos de entrenamiento hasta 7x y mejorando rendimiento hasta +8.9 puntos.

2026-06-16 · 2 min

Optimización de cobertura sanitaria en Etiopía con aprendizaje aumentado

Optimiza la cobertura sanitaria en Etiopía con un enfoque de aprendizaje aumentado. Conoce el planificador HARP y sus algoritmos para maximizar la población

2026-06-16 · 1 min

PDFSharp C#: Útil, Ligero pero de Alcance Limitado

Revisión honesta de PDFSharp para C# en 2026: licencia MIT, soporte PDF/A, firmas digitales, pero con limitaciones en HTML a PDF. ¿Es la opción adecuada?

2026-06-15 · 4 min

Rails ganó por tener opiniones. Las apps nativas de IA necesitan lo mismo

Descubre por qué Rails triunfó al imponer opiniones y cómo las apps nativas de IA necesitan el mismo enfoque para ser coherentes y eficientes.

2026-06-13 · 2 min

Optimalidad asintótica de Thompson Sampling para bandidos aversos al riesgo

Un algoritmo de Thompson Sampling no paramétrico logra optimalidad asintótica en bandidos aversos al riesgo con recompensas subgaussianas.

2026-06-09 · 2 min

Flatland: Las aventuras del descenso de gradiente con pasos grandes

Descubre cómo el descenso de gradiente con pasos grandes puede converger en el borde de estabilidad, mejorando el entrenamiento de redes neuronales.

2026-06-08 · 1 min

Flatland: Las aventuras del descenso de gradiente con pasos grandes

Descubre cómo el descenso de gradiente con pasos grandes opera en el borde de estabilidad, logrando convergencia no monótona y mejorando la generalización.

2026-06-08 · 2 min

Descenso de gradiente en el borde de la estabilidad: modelo de energía libre

Descubre cómo el descenso de gradiente en el borde de la estabilidad genera oscilaciones persistentes y cómo un modelo de energía libre las predice.

2026-06-05 · 1 min

Harpoon: Guía de Variedades Generalizada para Difusión Tabular Condicionada

Descubre Harpoon, un método de difusión tabular que guía la generación de datos con restricciones en inferencia, superando limitaciones de métodos anteriores.

2026-06-05 · 2 min