#diverge

HELVAE: Autoencoders Multimodales con Divergencia Hellinger

Descubre cómo HELVAE mejora los autoencoders multimodales usando la divergencia Hellinger para representaciones latentes más expresivas y mejor equilibrio entre coherencia y calidad.

2026-06-12 · 2 min

BioDivergence: benchmark de contradicciones contextuales en abstracts biomédicos

BioDivergence: benchmark y taxonomía para detectar contradicciones contextuales en abstracts biomédicos. ¿Cómo mejora la verificación científica? Descúbrelo.

2026-06-11 · 2 min

Cuando el contexto regresa: internalización robusta en destilación on-policy

¿Sabías que reintroducir el contexto a un modelo destilado puede empeorar su rendimiento? Descubre cómo un ligero regularizador lo evita.

2026-06-11 · 2 min

Evaluación automatizada de la creatividad en modelos de lenguaje

Nuevo marco automatizado evalúa la creatividad de modelos de lenguaje en tareas abiertas: mide novedad, diversidad y cumplimiento.

2026-06-11 · 2 min

Más allá de la región de confianza uniforme por token en RL para LLMs

CPPO mejora la estabilidad y precisión del razonamiento en LLMs al superar las regiones de confianza uniformes. Nuevo enfoque de optimización.

2026-06-10 · 2 min

Más allá de la confianza uniforme en tokens en RL para LLM

CPPO mejora el razonamiento de LLM al reemplazar la confianza uniforme por divergencia de prefijo acumulativa. Mayor estabilidad y precisión.

2026-06-10 · 2 min

Flow-DPPO: Optimización de Política Proximal con Divergencia para Modelos Flow

Flow-DPPO mejora la generación de imágenes y video con RL online y restricción de divergencia, superando al ratio clipping. ¡Descubre cómo!

2026-06-10 · 2 min

Optimalidad de tokens FSQ en difusión continua para datos categóricos (TTS)

Los tokens FSQ son óptimos para difusión continua en datos categóricos. Este estudio demuestra que superan a modelos LLM en TTS siendo más pequeños y rápidos.

2026-06-10 · 2 min

Dinámica Rotacional: Cómo los Transformers Rechazan Respuestas

Descubre cómo los transformers separan respuestas correctas de incorrectas mediante una dinámica rotacional en sus capas ocultas. Un estudio revela patrones geométricos sorprendentes.

2026-06-09 · 3 min

Repensando la Regularización de Divergencia en RL para LLMs

Descubre DRPO: un nuevo método que reemplaza el recorte de ratio con regularización cuadrática suave para estabilizar el entrenamiento RL en modelos de lenguaje.

2026-06-09 · 1 min

Tu algoritmo de autoaprendizaje es un imitador adversarial secreto

Descubre cómo el autoaprendizaje de LLM es en realidad un imitador adversarial. Un nuevo algoritmo mejora la estabilidad y el rendimiento del ajuste fino sin datos de preferencia.

2026-06-09 · 2 min

Proyecciones baricéntricas de planes de transporte óptimo en variedades riemannianas

Convierte acoplamientos de transporte óptimo en mapas deterministas en variedades riemannianas con proyecciones baricéntricas. Intrínseco y tangencial.

2026-06-09 · 2 min

Características latentes en LLMs: alineando semántica y mecanismos

Nuevo método no supervisado identifica modos de continuación en LLMs alineando semántica y atribuciones mecanicistas para auditar mecanismos internos.

2026-06-09 · 1 min

DIVERGE: RAG mejorado con diversidad para búsqueda abierta

Descubre cómo Diverge, un marco RAG innovador, duplica la diversidad en respuestas sin sacrificar calidad. Ideal para búsquedas abiertas.

2026-06-09 · 2 min

La trampa de la confianza: ataques de calibración para GNN

Los modelos de GNN calibrados son vulnerables a ataques adversariales. El marco UGCA revela cómo aumentar el error de calibración manteniendo la precisión. ¡Conócelo!

2026-06-09 · 3 min

Diagnóstico de incógnitas con certificados de ignorancia estructurada

Descubre cómo los Certificados de Ignorancia Estructurada (SIC) entrenan a los modelos de IA para reconocer sus límites, reduciendo alucinaciones y mejorando la precisión en consultas complejas.

2026-06-09 · 2 min

Contratos Kernel: Acotando la Divergencia entre Entrenamiento e Inferencia

Los contratos kernel acotan la divergencia entre entrenamiento e inferencia, reduciendo sesgos en el gradiente de política en post-entrenamiento de RL.

2026-06-09 · 1 min

Enseñar el método, no la respuesta: Destilación privilegiada multimodal

Descubre cómo PTD-PO optimiza políticas multimodales sin revelar respuestas, mejorando el razonamiento complejo.

2026-06-08 · 3 min

Privacidad implica estabilidad: cotas de generalización en aprendizaje cuántico

Nuevas cotas de generalización para aprendizaje cuántico: privacidad y estabilidad van de la mano. Descúbrelo aquí.

2026-06-08 · 2 min

La Mesa Redonda Virtual: Personas Multi-Agente Simulan el Brainstorming Humano

Descubre cómo un sistema multi-agente simula el brainstorming humano con personas virtuales. Genera ideas diversas y las evalúa. Caso: gafas inteligentes.

2026-06-06 · 1 min