#libra

Aprendizaje de preferencias calibrado: ranking de etiquetas

Descubre cómo la calibración mejora la precisión en rankings de etiquetas y su aplicación en RLHF.

2026-06-01 · 3 min

COFT: Razonamiento Justo con Cadena de Pensamiento en LLMs

COFT reduce sesgos en LLMs hasta un 55% sin reentrenar, preservando calidad y razonamiento justo. Método auditado.

2026-06-01 · 2 min

Alineación humana, calibración y patrones en la incertidumbre de LLMs

Descubre cómo los LLMs reflejan la incertidumbre humana mediante alineación, calibración y patrones de activación. Un estudio clave para entender y combatir alucinaciones.

2026-06-01 · 2 min

Calibración de atención cross-modal para reducir alucinaciones en LVLM

CMAC: un método sin entrenamiento que calibra la atención cross-modal para mitigar alucinaciones en LVLMs. Corrige sesgos y mejora la consistencia visual-textual.

2026-06-01 · 3 min

Alineación humana y calibración de incertidumbre en LLMs

Descubre cómo las medidas de incertidumbre en tiempo de inferencia se alinean con la incertidumbre humana y mejoran la calibración en grandes modelos de lenguaje.

2026-06-01 · 2 min

Calibración sin objetivo ante cambios de distribución con FGR

Descubre cómo FGR mejora la calibración de modelos de IA ante cambios de distribución sin necesidad de datos del destino. Aprende a implementarlo.

2026-06-01 · 2 min

ForecastCompass: Memoria adaptativa para predicción agéntica

Descubre cómo ForecastCompass (FoCo) mejora la predicción agéntica usando memoria de factores adaptativa, aumentando precisión y calibración en entornos dinámicos.

2026-06-01 · 2 min

Enrutamiento Variacional: Marco Bayesiano Escalable para Transformers MoE

Descubre VMoER, un marco bayesiano que mejora la incertidumbre en MoE con un 94% menos error y solo 1% más de FLOPs.

2026-06-01 · 2 min

Caracterización empírica de transformaciones de probabilidad en LLMs

Descubre cómo las transformaciones de probabilidad inducidas en tiempo de inferencia en LLMs siguen patrones log-ratio reproducibles. Un análisis empírico de 4,975 problemas.

2026-06-01 · 2 min

MAAT: nuevo método de desaprendizaje dirigido con adaptadores

Descubre cómo MAAT, un nuevo método de desaprendizaje dirigido, resuelve el sesgo en la evaluación de conocimiento causal con el benchmark 5WBENCH.

2026-06-01 · 3 min

Colapso de representación en el entrenamiento secuencial posterior de LLMs

Descubre cómo el entrenamiento secuencial de LLMs provoca colapso de representación y qué intervenciones pueden preservar la plasticidad y la generalización.

2026-06-01 · 2 min

Chatterbox-Flash: difusión de bloques calibrada para TTS streaming

Chatterbox-Flash revoluciona la síntesis de voz zero-shot con difusión de bloques calibrada, permitiendo streaming de alta fidelidad y baja latencia.

2026-06-01 · 2 min

BOKBO: Abstención Calibrada para Políticas de Visión-Lenguaje-Acción

Descubre BOKBO, un método de abstención calibrada que garantiza seguridad en políticas VLA. Reduce violaciones y mejora el éxito de tareas robóticas.

2026-06-01 · 2 min

FinVerBench: Validez del benchmark y calibración en la verificación de estados financieros de grandes modelos de lenguaje

FinVerBench analiza la validez del benchmark y calibración en verificación financiera con LLMs. Mejora la precisión y fiabilidad de modelos de lenguaje en el sector financiero.

2026-05-30 · 2 min

OmniMatBench: Un punto de referencia de razonamiento multimodal calibrado por humanos en 19 subcampos de la ciencia de materiales

2026-05-30 · 1 min

Conf-Gen: Cuantificación de Incertidumbre Conformal para Modelos Generativos

MEC: Calibración de entropía generalizada asistida por aprendizaje automático para la estimación de la media semisupervisada

Estimación semisupervisada de la media con calibración de entropía y aprendizaje automático. Técnica avanzada para optimizar predicciones con datos mixtos.

2026-05-29 · 2 min

#libra

Aprendizaje de preferencias calibrado: ranking de etiquetas

COFT: Razonamiento Justo con Cadena de Pensamiento en LLMs

Alineación humana, calibración y patrones en la incertidumbre de LLMs

Calibración de atención cross-modal para reducir alucinaciones en LVLM

Alineación humana y calibración de incertidumbre en LLMs

Calibración sin objetivo ante cambios de distribución con FGR

ForecastCompass: Memoria adaptativa para predicción agéntica

Enrutamiento Variacional: Marco Bayesiano Escalable para Transformers MoE

Caracterización empírica de transformaciones de probabilidad en LLMs

MAAT: nuevo método de desaprendizaje dirigido con adaptadores

Colapso de representación en el entrenamiento secuencial posterior de LLMs

Chatterbox-Flash: difusión de bloques calibrada para TTS streaming

BOKBO: Abstención Calibrada para Políticas de Visión-Lenguaje-Acción

FinVerBench: Validez del benchmark y calibración en la verificación de estados financieros de grandes modelos de lenguaje

OmniMatBench: Un punto de referencia de razonamiento multimodal calibrado por humanos en 19 subcampos de la ciencia de materiales

Conf-Gen: Cuantificación de Incertidumbre Conformal para Modelos Generativos

Esta laptop Acer de 2.2 libras promete de alguna manera 30 horas de duración de batería

Posición: Deja de perseguir el índice C al evaluar modelos de análisis de supervivencia

Calibrando modelos generativos a restricciones distribucionales

MEC: Calibración de entropía generalizada asistida por aprendizaje automático para la estimación de la media semisupervisada