#lbr · DeepCodeNews

Casa Blanca exige a Anthropic blindar Fable 5; expertos lo ven imposible

La administración Trump exige a Anthropic que Fable 5 sea a prueba de jailbreaks. Expertos: es técnicamente imposible. Descubre por qué.

2026-06-17 · 2 min

PIVOT: Puente entre volatilidad implícita y objetivos de precio

PIVOT revoluciona la valoración de opciones: operador diferenciable que preserva precisión de Jäckel y reduce error MAE hasta 43%.

2026-06-17 · 1 min

Seguridad en agentes de código de IA: ataques de jailbreak

JAWS-Bench: un benchmark que evalúa ataques de jailbreak a agentes de IA. Descubre cómo los modelos de lenguaje ejecutan código malicioso y cómo defenderte.

2026-06-17 · 1 min

Sobreyectividad en redes neuronales: ¿Puede generar cualquier salida?

¿Pueden las redes neuronales generar cualquier salida? Implica riesgos de jailbreak. Descubre cómo la sobreyectividad afecta la seguridad de tus modelos de IA.

2026-06-17 · 3 min

AnchorKV: Compresión segura de caché KV con penalización suave

Descubre AnchorKV, un método innovador para comprimir la caché KV de LLMs que mejora la seguridad frente a ataques jailbreak sin perder rendimiento. Ideal para

2026-06-17 · 2 min

Red Team a Modelos Anthropic: Fable 5 y Opus 4.8

Analizamos la resistencia de Fable 5 y Opus 4.8 a miles de ataques automatizados. ¿Son realmente seguros? Descubre los sorprendentes resultados.

2026-06-17 · 2 min

Estructuras latentes compartidas para detectar puertas traseras en LLMs

Descubre cómo las estructuras latentes compartidas en LLMs permiten detectar y mitigar ataques de puerta trasera unificada. Un avance en seguridad de IA.

2026-06-17 · 3 min

Claude explica por qué Fable 5 no está disponible

Claude Fable 5 fue bloqueado por el gobierno por 'seguridad nacional'. ¿El motivo? Pedirle que lea código. Conoce la verdad detrás de la polémica y quién

2026-06-17 · 2 min

MLingualFC: Evaluación de jailbreak en VLMs multilingües

Descubre cómo MLingualFC revela vulnerabilidades de jailbreak en VLMs multilingües usando diagramas de flujo.

2026-06-16 · 2 min

$Más allá del éxito/fracaso: Process Mining revela patrones de ataque a LLMs$

Más allá del éxito/fracaso: Process Mining revela patrones de ataque a LLMs

Descubre cómo el Process Mining revela patrones ocultos de resistencia y vulnerabilidad en LLMs ante ataques de Red Team, más allá de la simple tasa de éxito.

2026-06-16 · 2 min

$Process Mining: Más allá del acierto/fracaso en ataques Red Team$

Process Mining: Más allá del acierto/fracaso en ataques Red Team

El Process Mining revela que GPT-OSS y Llama 3.3 tienen defensas estructuralmente distintas, más allá de la simple tasa de éxito. Descúbrelo aquí.

2026-06-16 · 2 min

Más allá de los benchmarks en inglés: evaluación clínica de LLM en portugués

ClinicalBr, el primer benchmark bilingüe para evaluar LLM clínicos en portugués. Analizamos la brecha entre inglés y portugués en diagnóstico y tratamiento.

2026-06-16 · 3 min

Ataques CFD a agentes LLM que usan herramientas

Descubre cómo los ataques CFD explotan brechas de procedencia en agentes LLM que usan herramientas, superando defensas actuales en hasta un 28%. Aprende a

2026-06-16 · 1 min

Seguridad adaptativa: activar conciencia latente en modelos de razonamiento

Descubre cómo los modelos de razonamiento activan su conciencia de seguridad latente con SFT y DPO, reduciendo ataques hasta un 36%.

2026-06-16 · 2 min

GAS-Leak-LLM: Jailbreaking con Algoritmos Genéticos en Caja Negra

GAS-Leak-LLM usa algoritmos genéticos para crear sufijos adversariales y eludir la seguridad de los LLM en caja negra. Estudio revela vulnerabilidades.

2026-06-16 · 1 min

Seguridad computacional para IA generativa: perspectiva de pruebas de hipótesis

Descubre cómo la seguridad computacional en IA generativa usa pruebas de hipótesis para detectar prompts maliciosos y contenido generado.

2026-06-16 · 2 min

Killbench: ¿Podemos detener la IA maliciosa?

Killbench evalúa si podemos detener una IA maliciosa usando solo señales externas. Descubre los métodos y resultados en este benchmark.

2026-06-16 · 2 min

¿GPU obligatoria para tu LLM? Clasificadores CPU y pipelines multi-etapa

¿GPU necesaria para seguridad de LLM? Los clasificadores CPU igualan rendimiento al 20% del coste. Descubre el pipeline GuardChain.

2026-06-16 · 3 min

Fable 5: el 'arregla este código' que asustó al gobierno

Un simple prompt 'arregla este código' provocó que EE.UU. bloqueara modelos de IA avanzados. ¿Realmente fue un jailbreak? Una experta en bug bounties lo desmiente.

2026-06-16 · 2 min

Restricciones de EE.UU. a Anthropic impulsan soberanía europea

EE.UU. impide acceso a modelos de IA de Anthropic a no ciudadanos, impulsando la urgencia de una soberanía digital europea. Conoce las implicaciones.

2026-06-15 · 2 min