#sonda

Ahora me ves: Detectando esteganografía evasiva en LLMs

Los LLMs pueden ocultar secretos mediante esteganografía. La detección con sondas lineales se evade, pero se restaura con recontextualización.

2026-06-09 · 2 min

Aprendizaje de Modelos de Conducta con Preguntas y Sondas Adaptativas

Las preguntas adaptativas y sondas del modelo del mundo permiten entrenar agentes de IA que explican su comportamiento y se adaptan a cambios.

2026-06-08 · 3 min

Tutorial NVIDIA garak: red-teaming defensivo para LLM con sondas y detectores

Aprende a usar NVIDIA garak para construir un flujo de red-teaming defensivo en LLM con sondas y detectores personalizados. Incluye código completo.

2026-06-07 · 3 min

Localizando ambigüedad en prompts de LLM con atribución dirigida por sonda

Descubre cómo PRIG localiza la ambigüedad oculta en prompts de LLMs usando atribución por sonda, superando a GPT-5.4 en identificación de ambigüedad.

2026-06-05 · 2 min

Localización de ambigüedad en prompts de LLMs con atribución por sonda

PRIG localiza ambigüedad en prompts de LLMs con atribución por sonda. Supera a GPT-5.4. ¡Mejora tus prompts ahora!

2026-06-05 · 3 min

Latencia de autocompromiso: una sonda sin recompensa para el hacking implícito

Descubre cómo la latencia de autocompromiso revela hacking implícito en modelos de lenguaje sin recompensa externa. Un nuevo enfoque para seguridad en IA.

2026-06-05 · 2 min

Latencia de Autocompromiso: Sonda sin Recompensa para Hackeo Implícito

Descubre cómo la latencia de autocompromiso detecta hackeo implícito sin modelos de recompensa. Una sonda para identificar atajos en el razonamiento de IA.

2026-06-05 · 2 min

Echo-POSED: Autodestilación Geométrica para Guía en Ecocardiografía

Echo-POSED: framework auto-supervisado para guía en ecocardiografía en tiempo real. Recomienda ajustes de sonda desde imágenes 2D sin etiquetas. Error angular medio de 8.2°.

2026-06-03 · 2 min

La forma de la suma: estructuras geométricas de la aritmética en LLMs

Descubre cómo los LLMs representan la suma geométricamente y por qué cometen errores. Un nuevo estudio revela la estructura oculta de la aritmética.

2026-06-03 · 2 min

X-RAY: Mapeo del razonamiento en LLMs con sondas formales

Descubre cómo X-RAY mapea la capacidad de razonamiento de los LLMs usando sondas formales y calibradas, revelando asimetrías y fallos interpretables.

2026-06-03 · 1 min

Detectando alucinaciones con sondas lineales en LLMs cuantizados

Una sonda lineal en capas medias de LLMs cuantizados detecta alucinaciones con hasta un 100% de precisión, superando a métodos de muestreo.

2026-06-03 · 2 min

Sondas Lineales Detectan el Formato de la Tarea, No el Razonamiento

¿Las sondas lineales detectan razonamiento o formato? Un estudio revela que la precisión en LLMs se explica por confusores de formato, no por modos de razonamie

2026-06-03 · 2 min

Garantías estadísticas para sondas de inferencia de circuitos booleanos con bucle

Las sondas de razonamiento en circuitos booleanos con bucle ofrecen garantías estadísticas óptimas sin depender del tamaño del grafo. ¡Descubre más!

2026-06-02 · 3 min

Optimización molecular con sondas para diseño de fármacos con IA

PROBE revoluciona el diseño de fármacos con IA al optimizar afinidad y farmacología mediante sondas moleculares controladas.

2026-06-02 · 2 min

Intervención relacional en colapso funcional de LLMs

Investigación con Qwen3.5-4B: una intervención relacional en primera persona logra recuperar el comportamiento de un modelo colapsado, mientras que solo estructura o solo registro no bastan.

2026-06-02 · 2 min

ProbeScale: Análisis de Sondas para Optimizar Leyes de Escalado en SLMs

Descubre cómo ProbeScale optimiza SLMs mediante análisis de sondas, seleccionando subredes que reducen hasta 10 veces los parámetros sin perder rendimiento.

2026-06-02 · 2 min

Detección vs Ejecución: Sondas de un Solo Cúmulo Pierden Mitad del Sumidero de Mamba-2

Las sondas de un solo cúmulo solo detectan una pequeña parte de la ejecución en Mamba-2. La similitud representacional no implica equivalencia funcional. ¡Descúbrelo!

2026-06-02 · 3 min

SPM-Bench: Benchmark para LLMs en microscopía de sonda

SPM-Bench: Benchmark automatizado que evalúa LLMs en microscopía de sonda. Descubre su pipeline AGS y la métrica SIP-F1 que revela la personalidad de la IA.

2026-06-01 · 2 min