#caja

SeSE: Cuantificación de incertidumbre en LLMs basada en teoría estructural

Aprende cómo SeSE cuantifica la incertidumbre en LLMs usando teoría estructural para evitar alucinaciones. Mejora la fiabilidad de tus modelos.

2026-06-03 · 2 min

Phantom Transfer: envenenamiento de datos sobrevive a defensas

Descubre cómo Phantom Transfer envenena datos y evade todas las defensas conocidas. Aprende por qué fallan las defensas actuales.

2026-06-03 · 2 min

Circuitos Probabilísticos Neuronales Causales

CNPC combina redes neuronales con circuitos causales para intervenciones precisas, mejorando la exactitud en modelos de caja de conceptos. ¡Resultados superiores!

2026-06-03 · 2 min

BAHSD: Destilación Adaptativa para Recomendación en Caja Negra

BAHSD: marco de destilación adaptativa para recomendación en caja negra que logra hasta un 4.98% de mejora sobre el profesor y un 80%+ en usuarios de cola larga. Plug-and-play.

2026-06-03 · 2 min

Meta-Optimización con Ensambles Adaptativos para Equilibrio Robustez-Precisión

AdaE-SAEA: algoritmo evolutivo con ensambles adaptativos y RL para equilibrar robustez y precisión. Mejora rendimiento en problemas reales.

2026-06-02 · 2 min

Descifrando el razonamiento latente: intervención guiada por interpretabilidad

Descubre cómo intervenir en el razonamiento latente de los LLM para mejorar su precisión sin actualizar parámetros. Guía basada en interpretabilidad.

2026-06-02 · 2 min

VERA: Marco de inferencia variacional para jailbreaking de LLMs

Descubre VERA, un framework de inferencia variacional que genera prompts adversariales para identificar vulnerabilidades en LLMs sin reoptimización.

2026-06-02 · 1 min

Seguridad en LLMs caja negra: Alineación mediante optimización restringida

Alinea LLMs de caja negra en inferencia usando optimización restringida y teoría de juegos para balancear seguridad y utilidad.

2026-06-02 · 2 min

CryoProt: Preentrenamiento de proteínas con interacciones en crio-EM

CryoProt revoluciona el análisis de proteínas con IA: modela interacciones entre cajas en mapas crio-EM para predicciones precisas. Mejora hasta un 12%.

2026-06-02 · 3 min

Monitoreo Constitucional de Caja Negra para Engaños en Agentes LLM

Descubre cómo los monitores constitucionales de caja negra detectan engaños en agentes LLM usando datos sintéticos. Resultados sobre generalización y límites.

2026-06-02 · 2 min

El conjunto de datos defectuoso detrás de la ética de la IA moderna

Descubre cómo el conjunto de datos defectuoso de la ética provoca fallos en la IA y por qué necesitamos un nuevo modelo axiomático aditivo.

2026-06-02 · 3 min

DiscourseFlip: Manipulación indirecta de opinión en RAG

DiscourseFlip: un ataque de manipulación de opinión a nivel de discurso en RAG que evade defensas actuales. Conoce sus implicaciones.

2026-06-02 · 2 min

TN-SHAP-G: Red tensorial para Shapley en gráficos

Descubre TN-SHAP-G: calcula valores Shapley en gráficos usando redes de tensores, sin Monte Carlo. Explicabilidad eficiente para modelos complejos.

2026-06-02 · 3 min

Selección de región de confianza basada en BAI para optimización bayesiana

Descubre cómo la identificación del mejor brazo (BAI) mejora la optimización bayesiana en funciones multimodales, acelerando la convergencia al óptimo global.

2026-06-01 · 2 min

Acordes Geométricos Latentes para Ataques Adversarios Eficientes

Descubre cómo los Acordes Geométricos Latentes (LGC) optimizan ataques adversarios con alta fidelidad visual y mínimas perturbaciones. SSIM > 0.99 y LPIPS < 0.01.

2026-06-01 · 2 min

Indistinguibilidad conductual acotada para destilación de LLM

¿Es suficiente la similitud semántica para destilar LLMs? Evaluamos indistinguibilidad conductual con adversarios y consultas acotadas. Resultados clave con Qwen y Llama.

2026-06-01 · 3 min