#delos

Más allá de la precisión: interpretando temas en detección de ideación suicida

Descubre cómo la aumentación de temas mejora la interpretabilidad de modelos de IA para detectar ideación suicida, revelando factores de riesgo ocultos.

2026-06-16 · 1 min

Protocolo ACUTE: mejora calibración, utilidad y confianza en LLMs

Descubre el protocolo ACUTE: mejora la calibración, utilidad y confianza de modelos de lenguaje. Ideal para aplicaciones de IA más seguras.

2026-06-16 · 3 min

$Más allá del éxito/fracaso: Process Mining revela patrones de ataque a LLMs$

Más allá del éxito/fracaso: Process Mining revela patrones de ataque a LLMs

Descubre cómo el Process Mining revela patrones ocultos de resistencia y vulnerabilidad en LLMs ante ataques de Red Team, más allá de la simple tasa de éxito.

2026-06-16 · 2 min

Protocolo ACUTE: Mejorando Calibración y Confianza en LLMs

Descubre cómo el protocolo ACUTE mejora calibración, utilidad y confianza de LLMs mediante activaciones, reduciendo sobreconfianza.

2026-06-16 · 2 min

Más allá de los benchmarks ingleses: evaluación de LLM clínicos en portugués

Descubre cómo se desempeñan los LLM clínicos en portugués brasileño frente al inglés. Análisis del benchmark ClinicalBr en diagnóstico, tratamiento y más.

2026-06-16 · 1 min

Multiplicidad de modelos para detección adversarial en SLM edge

Aprende cómo la multiplicidad de modelos detecta ataques de envenenamiento en SLM en dispositivos edge, mejorando la seguridad antes que defensas clásicas.

2026-06-16 · 2 min

El último píxel visible: sondeando percepción fina en VLMs

Nuevo benchmark FineSightBench revela que la percepción fina en VLMs satura a 12px y el razonamiento visual es limitado.

2026-06-16 · 2 min

Datos instrumentados para aprendizaje automático científico causal

Descubre cómo los datos instrumentados (con modelos causales y contrafactuales) revolucionan el ML científico. Ideal para biología, clima, materiales y más.

2026-06-16 · 2 min

Coherencia Tensa: Señal de Falla Previa en Agentes de Código

Descubre cómo la coherencia tensa revela fallos inminentes en agentes de IA. Un detector con 94% de precisión identifica cuándo un agente ignora sus propias

2026-06-16 · 2 min

Multiplicidad de modelos para detección adversarial en SLM en el borde

La multiplicidad de modelos detecta ataques de envenenamiento en dispositivos edge, mejorando la seguridad en entrenamiento distribuido de SLM.

2026-06-16 · 2 min

Larch: Optimización Aprendida para Predicados Semánticos

Descubre cómo Larch optimiza filtros semánticos en SQL usando IA y embeddings, reduciendo costos de tokens hasta 19x comparado con soluciones existentes.

2026-06-16 · 1 min

El último píxel visible: probando la percepción fina en VLMs

¿Qué tan pequeño puede percibir un VLM? FineSightBench revela que la percepción se satura a 12px, pero el razonamiento sigue limitado.

2026-06-16 · 2 min

Datos instrumentados para machine learning científico causal

Datos instrumentados: modelos, incertidumbre y contrafactuales para ML científico causal. Aplicaciones en validación y auditoría.

2026-06-16 · 1 min

Larch: Optimización de Consultas Semánticas con IA

Descubre cómo Larch optimiza filtros semánticos en SQL con IA, reduciendo costos de tokens hasta 19x. Ideal para grandes volúmenes de datos no estructurados.

2026-06-16 · 2 min

POISE: Inyección de habilidades indetectable en agentes LLM

Descubre cómo POISE logra una tasa de éxito del 89.3% inyectando habilidades maliciosas sin ser detectado, superando las defensas actuales.

2026-06-16 · 1 min

De 'Puede' a 'Es': Distorsión de Certeza en Modelos de Lenguaje

Los modelos de lenguaje aumentan la certeza al reescribir textos, distorsionando la información en un 75%. Conoce el sesgo que afecta dominios de alto riesgo.

2026-06-16 · 1 min

RecurGuard: Defensa en tiempo real contra ataques de tokens de razonamiento

RecurGuard detecta el 99% de ataques de consumo de tokens en modelos de lenguaje. Monitoreo en tiempo real.

2026-06-16 · 1 min

La Neutralidad Muerde: Representación de Género en Fábulas IA

Descubre cómo los LLM generan un sesgo masculino en cuentos de animales, incluso al intentar ser neutrales. ¿Es la neutralidad una forma de borrado? Lee más.

2026-06-16 · 1 min

Defendiendo contra el ajuste fino malicioso escalando ataques adversariales

Descubre cómo Patcher protege los modelos de lenguaje contra ataques de fine-tuning malicioso escalando ataques adversariales. Mejora la robustez de tus LLMs.

2026-06-16 · 2 min

PRISM: Muestreo de Acciones Guiado por Prior en Modelos del Mundo

Descubre PRISM, un marco que mejora el muestreo de acciones en modelos del mundo. Aumenta el éxito hasta un 35% en control continuo.

2026-06-16 · 2 min