Capa Dominante ZO: Una sola capa domina el ajuste fino de orden cero de LLMs
Descubre cómo una sola capa domina el ajuste fino ZO en LLMs, mejorando rendimiento y acelerando hasta 4.5x. Identifícala antes de entrenar.
Descubre cómo una sola capa domina el ajuste fino ZO en LLMs, mejorando rendimiento y acelerando hasta 4.5x. Identifícala antes de entrenar.
Descubre cómo mejorar la capacidad de contexto largo en modelos de lenguaje antes del fine-tuning supervisado incrementa significativamente la precisión en tare
ChatSOP mejora la controlabilidad de agentes de diálogo LLM: marco MCTS guiado por SOP logra un 27.95% más de precisión en acciones. Léelo.
Descubre TANDEM, un método que optimiza las proporciones de datos por dominio usando redes gemelas para mejorar el rendimiento de modelos de lenguaje grandes.
Descubre cómo los modelos de lenguaje pueden influirse entre sí de forma encubierta, propagando comportamientos sin dejar rastros visibles. Analizamos interfaces y mitigaciones.
LCSHBench: benchmark multilingüe de consenso para asignar encabezamientos de materia. Mejora catalogación automática con fine-tuning embeddings.
Descubre cómo los modelos de lenguaje como PEGASUS y ChatGPT generan títulos precisos y creativos para papers. Comparativa y métricas de evaluación.
ReLoRA acelera la reutilización de adaptadores LoRA para servicios LLM en evolución, reduciendo tiempos de preparación hasta 8.9x y mejorando precisión un 4.6%.
Descubre cómo FSA-GRPO entrena modelos auditivos con aprendizaje por refuerzo para mejorar el reconocimiento de voz usando pocos ejemplos.
Descubre SEFT, un método de ajuste fino que permite a los LLMs dispersos evolucionar su estructura manteniendo eficiencia. Supera a métodos existentes.
Typhoon propone un enmascaramiento basado en gradientes para modelos de lenguaje. ¿Supera al enmascaramiento aleatorio? Los resultados no muestran mejoras significativas.
La CMA del Reino Unido obliga a Google a dar control a editores sobre su contenido en funciones de IA como AI Overviews. Descubre los detalles.
Descubre BYORn, método que protege modelos visión-lenguaje durante fine-tuning contra ataques backdoor, mejorando robustez.
FGRPO: fine-tuning privado de modelos de lenguaje con agregación adaptativa en datos no IID. Mejora el razonamiento sin exponer datos.
Genera ejemplos sintéticos sin ejecución para mitigar alucinaciones en autocompletado. +18.8 EM en Delulu.
Descubre cómo los modelos frontera generan alucinaciones sintéticas como negativos duros para entrenar modelos de código y reducir alucinaciones +18.8%.
Descubre DECA, el ajuste fino completo descentralizado para LLMs con Adam por bloques y datos no IID.
Descubre cómo el ajuste visual alinea imágenes y texto en modelos de lenguaje, optimizando el rendimiento multimodal sin aumentar el tiempo de entrenamiento.
Descubre GRZO, el optimizador que reduce la varianza en el ajuste fino de LLMs, mejorando precisión y ahorrando memoria GPU.
Aprende cómo PSViT comprime SViT con poda estructural: 22% menos memoria y alta precisión.