#opd · DeepCodeNews

PowerOPD: Destilación on-policy estable con transformación acotada

PowerOPD estabiliza la destilación on-policy con transformación acotada, mejora hasta +6.37% en razonamiento matemático y reduce tiempo un 59%.

2026-06-17 · 1 min

GDP Gaussiano para reportar privacidad diferencial en ML

Descubre cómo el GDP Gaussiano no asintótico ofrece reportes precisos de privacidad diferencial en ML, evitando conclusiones engañosas.

2026-06-17 · 1 min

Stage-1: control de entropía, no del resultado

Descubre cómo el Stage-1 en el post-entrenamiento de VLMs controla el régimen de entropía, pero no mejora significativamente el resultado final. Estudio con

2026-06-16 · 3 min

X-OPD: Destilación multimodal para alinear modelos de habla con texto

Descubre cómo X-OPD cierra la brecha entre modelos de habla y texto mediante destilación multimodal, mejorando la precisión sin perder capacidades.

2026-06-15 · 3 min

Alternativa a DinkToPdf en C#: El riesgo oculto de dependencias en 2026

Descubre el riesgo oculto de DinkToPdf: su dependencia wkhtmltopdf está archivada. ¿Es segura tu app .NET? Explora alternativas modernas.

2026-06-12 · 2 min

AutoPDE: Solución Confiable de PDEs con Estrategias Explícitas

AutoPDE: agente IA que separa estrategia numérica del código. Resuelve PDEs de forma confiable con métodos explícitos.

2026-06-10 · 3 min

Alternativa a WkhtmltoPdf en C#: Soporte y Seguridad en 2026

¿Sigue siendo seguro wkhtmltopdf en 2026? Conoce los riesgos CVE-2022-35583 y alternativas modernas para tu proyecto .NET.

2026-06-08 · 2 min

Destilación on-policy para transformar modelos autoregresivos en difusivos

Descubre cómo OPDLM transforma modelos autoregresivos en difusivos con destilación on-policy, reduciendo tokens de entrenamiento hasta 7000x sin perder rendimiento.

2026-06-08 · 1 min

Filtrar, luego repesar: Nueva granularidad en destilación on-policy

FiRe-OPD mejora la destilación on-policy con filtrado de trayectorias y repesado suave de tokens. Obtén +6.25 en AIME 2024 y +18.81 en Miner ¡Optimiza tus LLMs!

2026-06-03 · 1 min