#modelos lenguaje

Ataques backdoor generalizables en RLHF con triggers emocionales

Descubre cómo GREAT genera ataques backdoor en RLHF usando desencadenantes emocionales. Revela nuevas vulnerabilidades en seguridad de IA.

2026-06-02 · 2 min

Dialéctica del alineamiento: conocimiento inseguro para enrutamiento dinámico

SafeMoE aprovecha conocimiento inseguro para respuestas seguras e informativas, superando en un 20% la tasa de seguridad. Un nuevo paradigma en alineamiento.

2026-06-02 · 2 min

EuraGovExam: Benchmark multilingüe de exámenes de servicio civil

Descubre EuraGovExam, un benchmark con exámenes reales de servicio civil en 5 regiones. Evalúa VLMs en razonamiento visual multilingüe. Resultados reveladores.

2026-06-02 · 2 min

Comienza con OpenAI GPT-5.5, GPT-5.4 y Codex en Amazon Bedrock

Descubre cómo usar los modelos OpenAI GPT-5.5, GPT-5.4 y Codex en Amazon Bedrock para desarrollo de software con IA. Aprende a implementarlos.

2026-06-02 · 2 min