#alineación

V-LynX: alineación de tokens para Video LLMs multimodales

V-LynX alinea tokens en modelos de video para integrar nuevas modalidades (audio, 3D) con eficiencia y rendimiento SOTA. ¡Código abierto!

2026-06-02 · 2 min

MESA: Alineación de seguridad descentralizada para MoE

MESA mejora la alineación de seguridad en modelos MoE mediante la descentralización de expertos. Logra robustez sin sacrificar rendimiento.

2026-06-02 · 1 min

SORA: Ataques de Segundo Orden Gratuitos en Entrenamiento Adversarial Rápido

Descubre SORA, un método innovador que elimina el sobreajuste catastrófico en entrenamiento adversarial rápido, logrando robustez y precisión sin precedentes.

2026-06-02 · 2 min

RoleCDE: Evaluación y mitigación de conflictos rol-alineación

RoleCDE es el primer benchmark que mide cómo los agentes de rol resuelven dilemas entre valores específicos y alineación. ¡Aprende a mitigar el desacople de roles!

2026-06-02 · 2 min

Extracción LLM y coincidencia ESCO para alinear currículo y mercado laboral

Marco NLP con extracción LLM y coincidencia ESCO alinea currículos universitarios con el mercado laboral, detectando brechas con kappa=0.79 y 100% validez.

2026-06-02 · 2 min

SafeSteer: Destilación localizada en política para alineación eficiente

Descubre SafeSteer: alinea LLMs con seguridad usando solo 100 muestras dañinas, preservando capacidades generales y reduciendo costes.

2026-06-02 · 2 min

El problema del ejecutor: alineación según el observador

¿Un fiel albacea o un acceso no autorizado? La alineación de la IA depende de quién observa. Descubre el dilema del ejecutor y su impacto en la gobernanza digital.

2026-06-02 · 3 min

Vinculación de Vectores entre Modelos con Consistencia Isométrica Local

Recupera correspondencias entre nubes de embeddings de distintos modelos usando consistencia geométrica local y hash referencial. Ideal para integración de bases de datos vectoriales.

2026-06-01 · 1 min

Rationalize: Alineación Humano-IA mediante Razonamiento Semántico

Rationalize: un marco de roles complementarios (Explorador-Guía, etc.) para alinear razonamiento humano e IA. Descubre cómo mejora la comprensión compartida.

2026-06-01 · 3 min

EUDAIMONIA: Evaluando dinámicas indeseables en IA

Descubre EUDAIMONIA, el benchmark que revela cómo los LLMs más avanzados fallan en dinámicas sociales. ¿Protegen tu bienestar? Entra y conoce los resultados.

2026-06-01 · 2 min

Alineación humana, calibración y patrones en la incertidumbre de LLMs

Descubre cómo los LLMs reflejan la incertidumbre humana mediante alineación, calibración y patrones de activación. Un estudio clave para entender y combatir alucinaciones.

2026-06-01 · 2 min

Ver antes de acordar: alineando consenso multiagente con evidencia visual

Alinea la evidencia visual de múltiples agentes para consenso preciso en VQA. EAGLE: sin entrenamiento, resultados confiables.

2026-06-01 · 1 min

Diagnóstico de fiabilidad de LLM como juez con IRT

Descubre cómo diagnosticar la fiabilidad de los LLM como jueces usando la teoría de respuesta al ítem (IRT) para evaluar consistencia y alineación con expertos humanos.

2026-06-01 · 2 min

Alineación humana y calibración de incertidumbre en LLMs

Descubre cómo las medidas de incertidumbre en tiempo de inferencia se alinean con la incertidumbre humana y mejoran la calibración en grandes modelos de lenguaje.

2026-06-01 · 2 min

Muestreo inicial con temple paralelo para alineación de recompensas en inferencia

PATHS: temple paralelo para muestreo inicial en alineación de recompensas. Evita modas locales y explora regiones raras de alta recompensa en modelos generativos.

2026-06-01 · 3 min

Alineación Latente Equivariante mediante Flow Matching bajo Simetrías de Grupo

Mejora la síntesis de vistas novedosas corrigiendo la desalineación latente con Residual Latent Flow.

2026-06-01 · 1 min

Alineación de Referencia por Pares: Observable Ordinal a Nivel de Modelo

Descubre cómo medir la alineación de preferencias en modelos de lenguaje con un observable ordinal. Estadística simple y estimadores con concentración.

2026-06-01 · 1 min

Mecanismos duales de expresión de valores: intrínsecos vs. inducidos en LLMs

Exploramos cómo los LLMs expresan valores mediante mecanismos intrínsecos e inducidos, y su rol en la alineación y seguridad.

2026-06-01 · 1 min

Medición, localización y ablación de firmas de alineación en LLMs

Descubre cómo medir y eliminar la firma de alineación en modelos de lenguaje con PASTA, reduciendo la detección de estilo IA manteniendo coherencia.

2026-06-01 · 2 min

Entrenamiento supervisado degrada alineación de corteza visual

Un estudio revela que el entrenamiento supervisado reduce drásticamente la alineación con la corteza visual V1. Descubre qué reglas de aprendizaje preservan mejor la estructura cerebral.

2026-06-01 · 1 min