Ataques de caja negra, adaptativos y eficientes para romper LLMs
Nuevo ataque IHO vulnera LLMs incluso con defensas avanzadas. Evalúa robustez adversarial de forma eficiente y transferible. ¡Descúbrelo!
Nuevo ataque IHO vulnera LLMs incluso con defensas avanzadas. Evalúa robustez adversarial de forma eficiente y transferible. ¡Descúbrelo!
Typhoon propone un enmascaramiento basado en gradientes para modelos de lenguaje. ¿Supera al enmascaramiento aleatorio? Los resultados no muestran mejoras significativas.
MASC ofrece desaprendizaje rápido a gran escala para modelos de lenguaje, sin reentrenamiento. Mejora la eficiencia y preserva la utilidad. ¡Conoce el método!
Descubre AugMask: entrena modelos de difusión en datos tabulares incompletos con aumento estocástico. Mejora la generación de datos.
PaCX-MAE mejora el diagnóstico de rayos X integrando datos fisiológicos (ECG, laboratorio) sin requerirlos en inferencia. Logra +2.7 AUROC y +6.5 F1 con solo 1% de datos.
Los modelos de difusión enmascarada (MDLM) son sensibles a pequeños desplazamientos posicionales. Descubre cómo CTC mejora el ajuste fino y supera a la entropía cruzada en cuatro benchmarks.
Descubre d2, un marco de razonamiento para modelos de difusión que mejora el rendimiento en tareas lógicas y matemáticas, superando a RL tradicional.
MASCOT mejora consistencia y diálogo en agentes multi-sistema, evitando redundancias. Descubre su optimización bi-nivel para compañeros socio-colaborativos.
Descubre BlockGen: combina difusión uniforme y enmascarada con muestreo híbrido para generar secuencias por bloques de alta calidad. Supera modelos previos.
Políticas de orden adaptativo mejoran generación de secuencias en difusión enmascarada, superando heurísticas en tareas sensibles al orden como proteínas.
Descubre SimSD: un método de decodificación especulativa para modelos de difusión que acelera la inferencia hasta 7.46x sin sacrificar calidad.
DLLM-JEPA: nueva arquitectura que combina JEPA y difusión enmascarada para reducir FLOPs un 33% y ganar hasta 18.7% en precisión.
DSL-LLaDA adapta LLaDA para denoising continuo, evitando el compromiso longitud/calidad. Obtiene el mejor ROUGE-1 en resumen con pocos pasos.
Descubre cómo el enmascaramiento de observaciones obsoletas afecta a los agentes de búsqueda. Aprende cuándo mejora y cuándo empeora el rendimiento.
Estudio revela que MDLMs descifran entidades primero en generación texto-gráfico. SFT puede fallar, pero decodificación lambda recupera +9.4 BLEU.
Descubre cómo FP-MGMs y CoFRe reducen parámetros y costo de entrenamiento en modelos generativos enmascarados, mejorando calidad con menos recursos.
Descubre cómo TxFM, un modelo de autoaprendizaje por enmascaramiento, logra representaciones genómicas de alta fidelidad superando a modelos masivos.
Aprende cómo recordar dominios olvidados en aprendizaje incremental usando test-time training con autoencoder enmascarado y LoRA. Ideal para video.
Guía para generar metadescripciones SEO en español, breves, claras y atractivas.
<meta name="description" content="El atajo de la confianza revela un fallo de razonamiento en modelos de difusión enmascarados. Descubre cómo este error afecta a la IA y posibles soluciones.">