TamperBench: Evaluación de seguridad en LLM bajo ajuste y manipulación
Descubre TamperBench, el primer marco unificado para evaluar la resistencia de LLMs a manipulaciones y ajustes finos. Resultados clave y código abierto.
Descubre TamperBench, el primer marco unificado para evaluar la resistencia de LLMs a manipulaciones y ajustes finos. Resultados clave y código abierto.
SLMs ajustados con zero-shot logran 86.66% de precisión en roles líder-seguidor, superando a prompts. Ideal para computación edge.
Codificadores visuales con estado mejoran la comparación entre imágenes en modelos de visión-lenguaje, superando a especialistas en radiología y teledetección.
Descubre cómo los codificadores visuales con estado mejoran los modelos visión-lenguaje en tareas multi-imagen y superan a modelos en radiología y teledetección
Nuevo algoritmo transforma prompts en vectores y matrices de peso para editar modelos de lenguaje. Ahorra tiempo y mejora el control sin reentrenar.
Descubre cómo los componentes no suaves en Vision Transformer mejoran el ajuste fino. La plasticidad de atención y feedforward supera al smoothness tradicional.
Guía para lograr razonamiento eficiente de LLM en dispositivos de borde. Usamos LoRA, ajuste fino y refuerzo para reducir tokens y latencia sin perder precisión.
Preserva la alineación de seguridad de tus LLMs durante el fine-tuning con PACT: restricciones focalizadas en tokens de seguridad que evitan la deriva sin sacrificar rendimiento.
Descubre cómo Policy Split mejora la exploración dual en LLMs con regularización de entropía para mayor precisión y creatividad.
Descubre por qué los modelos entrenados para ser siempre útiles pueden presentar fallos inesperados de alineación, sycophancy y falta de control. Aprende cómo mitigarlos.
Descubre cómo mejora la calificación automática de tareas C++ con BART y rúbricas: menor error y distribuciones de notas más realistas.
Descubre BaltiVoice, el primer corpus de voz público para el idioma balti. Ajustamos Whisper y reducimos el error de 182% a 30%. ¡Modelo y demo disponibles!
¿Aprenden los LLM a representar el modelo del mundo al planificar? Este análisis revela cómo el ajuste supervisado codifica la validez de acciones y predicados.
Descubre SEFT, un método de ajuste fino que permite a los LLMs dispersos evolucionar su estructura manteniendo eficiencia. Supera a métodos existentes.
FGRPO optimiza modelos de razonamiento con agregación adaptativa en datos no IID, preservando privacidad.
Descubre DECA, el ajuste fino completo descentralizado para LLMs con Adam por bloques y datos no IID.
Descubre DECA: ajuste fino completo descentralizado de LLMs en datos no IID. Eficiente y rápido. ¡Infórmate!
Descubre ParaBlock: una técnica innovadora que acelera el aprendizaje federado de grandes modelos de lenguaje al paralelizar comunicación y computación, manteniendo el rendimiento.
Poda de redes profundas con distribución Marchenko-Pastur: precisión mantenida con mínimo ajuste fino. Resultados en ImageNet con ViT y CNNs.
Aplica protocolos de evaluación basados en pruebas de aceptación para sistemas LLM seguros, confiables y alineados con el negocio.