V-LynX: alineación de tokens para Video LLMs multimodales
V-LynX alinea tokens en modelos de video para integrar nuevas modalidades (audio, 3D) con eficiencia y rendimiento SOTA. ¡Código abierto!
V-LynX alinea tokens en modelos de video para integrar nuevas modalidades (audio, 3D) con eficiencia y rendimiento SOTA. ¡Código abierto!
MESA mejora la alineación de seguridad en modelos MoE mediante la descentralización de expertos. Logra robustez sin sacrificar rendimiento.
Descubre SORA, un método innovador que elimina el sobreajuste catastrófico en entrenamiento adversarial rápido, logrando robustez y precisión sin precedentes.
RoleCDE es el primer benchmark que mide cómo los agentes de rol resuelven dilemas entre valores específicos y alineación. ¡Aprende a mitigar el desacople de roles!
Marco NLP con extracción LLM y coincidencia ESCO alinea currículos universitarios con el mercado laboral, detectando brechas con kappa=0.79 y 100% validez.
Descubre SafeSteer: alinea LLMs con seguridad usando solo 100 muestras dañinas, preservando capacidades generales y reduciendo costes.
¿Un fiel albacea o un acceso no autorizado? La alineación de la IA depende de quién observa. Descubre el dilema del ejecutor y su impacto en la gobernanza digital.
Recupera correspondencias entre nubes de embeddings de distintos modelos usando consistencia geométrica local y hash referencial. Ideal para integración de bases de datos vectoriales.
Rationalize: un marco de roles complementarios (Explorador-Guía, etc.) para alinear razonamiento humano e IA. Descubre cómo mejora la comprensión compartida.
Descubre EUDAIMONIA, el benchmark que revela cómo los LLMs más avanzados fallan en dinámicas sociales. ¿Protegen tu bienestar? Entra y conoce los resultados.
Descubre cómo los LLMs reflejan la incertidumbre humana mediante alineación, calibración y patrones de activación. Un estudio clave para entender y combatir alucinaciones.
Alinea la evidencia visual de múltiples agentes para consenso preciso en VQA. EAGLE: sin entrenamiento, resultados confiables.
Descubre cómo diagnosticar la fiabilidad de los LLM como jueces usando la teoría de respuesta al ítem (IRT) para evaluar consistencia y alineación con expertos humanos.
Descubre cómo las medidas de incertidumbre en tiempo de inferencia se alinean con la incertidumbre humana y mejoran la calibración en grandes modelos de lenguaje.
PATHS: temple paralelo para muestreo inicial en alineación de recompensas. Evita modas locales y explora regiones raras de alta recompensa en modelos generativos.
Mejora la síntesis de vistas novedosas corrigiendo la desalineación latente con Residual Latent Flow.
Descubre cómo medir la alineación de preferencias en modelos de lenguaje con un observable ordinal. Estadística simple y estimadores con concentración.
Exploramos cómo los LLMs expresan valores mediante mecanismos intrínsecos e inducidos, y su rol en la alineación y seguridad.
Descubre cómo medir y eliminar la firma de alineación en modelos de lenguaje con PASTA, reduciendo la detección de estilo IA manteniendo coherencia.
Un estudio revela que el entrenamiento supervisado reduce drásticamente la alineación con la corteza visual V1. Descubre qué reglas de aprendizaje preservan mejor la estructura cerebral.