#destilación de conocimiento

Destilación de Crédito Guiada por Hermanos para Agentes Tool-Use

SGCD mejora la asignación de crédito en agentes tool-use con destilación guiada por hermanos, superando a GRPO en AppWorld y τ3-airline.

2026-06-12 · 2 min

Modelos pequeños superan a grandes: destilación dual para baterías en el borde

El marco DLNet demuestra que modelos pequeños pueden superar a grandes en pronósticos de batería para el borde. Implementado en Arduino con 94 kB y 21 ms, reduce error un 15.4%.

2026-06-12 · 2 min

MODF-SIR: Marco Multiagente Omni-Modal Destilado para Razonamiento Social

MODF-SIR: marco multiagente omni-modal destilado. Con adaptación en tiempo de prueba y LoRA, alcanza resultados de vanguardia con solo 30% datos.

2026-06-11 · 2 min

Redes neuronales destiladas con física y LLM para fabricación

Redes neuronales destiladas con física y LLM predicen propiedades en fabricación con alta precisión con datos escasos, para despliegue en tiempo real.

2026-06-11 · 2 min

Redes neuronales destiladas con física y LLMs para fabricación

Descubre cómo redes neuronales destiladas con física y LLMs predicen propiedades de fabricación incluso con datos escasos. Ideal para monitoreo en tiempo real.

2026-06-11 · 2 min

Predicciones fiables con destilación mixup más allá del conocimiento oscuro

Aprende cómo combinar destilación de conocimiento y mixup para obtener predicciones fiables, mejor calibración y menor sobreconfianza en redes neuronales.

2026-06-11 · 2 min

AuRA: internalizando audio en LLMs mediante LoRA

Descubre cómo AuRA internaliza la comprensión del audio en LLMs mediante LoRA, superando a sistemas en cascada con mayor eficiencia y precisión.

2026-06-10 · 2 min

Destilación adaptativa con heterofilia para redes neuronales de hipergrafos

HADES usa la heterofilia para destilar conocimiento en hipergrafos. Logra modelos ligeros hasta 12.3 veces más rápidos que el profesor.

2026-06-09 · 1 min

Estabilizando destilación on-policy para razonamiento MLLM

Descubre cómo la normalización global estabiliza la destilación on-policy en modelos multimodales, mejorando el razonamiento y evitando explosiones de gradiente.

2026-06-09 · 2 min

AliyunConsoleAgent: agentes web en cloud real con destilación y refuerzo

AliyunConsoleAgent entrena agentes web para verificar documentación en consolas cloud. Combina destilación y RL, logrando 63.52% éxito con 92% menos costo.

2026-06-09 · 3 min

Caracterizar y luego destilar: razonamiento mecanicista en grandes espacios

Aprende cómo los modelos de razonamiento seleccionan entre millones de etiquetas usando una estrategia de destilación mecanicista en dos fases.

2026-06-08 · 2 min

Destilación de Conocimiento Adelante-Atrás en Clustering Continuo No Supervisado

Descubre cómo el nuevo método FBCC evita el olvido catastrófico en clustering continuo sin etiquetas usando destilación adelante-atrás.

2026-06-08 · 2 min

Clustering Continuo No Supervisado con Destilación Bidireccional

Aprende cómo FBCC aplica destilación bidireccional para clustering continuo sin olvidar tareas anteriores. Reduce el olvido catastrófico.

2026-06-08 · 2 min

LRMIL: Aprendizaje eficiente en baja resolución para clasificación patológica

Aprende cómo LRMIL destila conocimiento de alta resolución a baja para clasificar imágenes patológicas con alta precisión y bajo coste.

2026-06-08 · 2 min

Planificación espacial visual con autodestilación de brecha de modalidad

MGSD mejora la planificación espacial visual un 19% mediante autodestilación consciente de brecha de modalidad, cerrando la brecha percepción-razonamiento.

2026-06-06 · 2 min

LoRi: Destilación de Bajo Rango para Razonamiento Implícito

Descubre LoRi: destilación de bajo rango que mejora el razonamiento implícito en LLMs, acercándose a cadenas de pensamiento explícitas.

2026-06-06 · 2 min

Drive-KD: Destilación multi-profesor para VLMs en conducción autónoma

Drive-KD destila conocimiento multi-profesor para VLMs en conducción autónoma: menor uso de GPU, mayor throughput y rendimiento superior en planificación.

2026-06-06 · 2 min

ViCuR: Pistas visuales como privilegio recuperable en destilación multimodal

ViCuR usa pistas visuales recuperables para destilación on-policy multimodal, mejorando razonamiento sin sesgos de atajos. Resultados mejores en benchmarks.

2026-06-05 · 3 min