LoRA-Muon: descenso espectral en el manifold de bajo rango
Descubre LoRA-Muon: optimiza fine-tuning con bajo rango, transfiere tasas de aprendizaje, supera líneas base densas. Eficiente en memoria.
Descubre LoRA-Muon: optimiza fine-tuning con bajo rango, transfiere tasas de aprendizaje, supera líneas base densas. Eficiente en memoria.
Descubre cómo RA-RFT combina recuperación inteligente y refuerzo para que los modelos de IA aprendan a razonar por analogía, mejorando resultados en matemáticas.
Descubre cómo la dirección de activación mejora la comprensión de interrupciones en modelos de voz full-duplex, elevando la precisión del 28% al 45% sin necesidad de entrenamiento.
Activación dirigida mejora comprensión de interrupciones en SLMs full-duplex. Corrección sube 28% a 45% y tasa palabra inicial 40% a 72%.
Aprende cómo ISE sintetiza trayectorias multi-turno y mejora agentes OS alcanzando un 37.7% en ClawEval, superando a GPT-4o.
Aprende cómo Trap² protege tus modelos de IA contra fusiones no autorizadas, degradando el rendimiento bajo reescalado sin afectar su uso legítimo.
Descubre MobileFineTuner, un framework en C++ que permite el ajuste fino de LLM directamente en smartphones. Reduce memoria y energía, ideal para IA embebida. ¡Lee más!
Convierte el ruido en descenso: nuevo marco de optimización de orden cero para ajustar LLMs con ahorro de memoria y mayor velocidad de convergencia.
Descubre cómo CADFT mejora el ajuste fino de modelos de lenguaje, reduciendo inestabilidad y mejorando la generalización sin necesidad de modelos de recompensa.
Descubre TI-Adapter: ajuste eficiente para aprendizaje multimodal tabular-imagen con rendimiento competitivo y menos parámetros entrenables.
Descubre ART, un innovador método de fine-tuning para LLMs multimodales que optimiza la entrada visual sin modificar pesos. Competitivo con LoRA en benchmarks.
Descubre cómo AsFT ancla la seguridad en el fine-tuning de LLMs, reduciendo conductas dañinas y mejorando el rendimiento del modelo.
InDex adapta modelos VLA a manos diestras sin perder generalización. Logra manipulación diestra con pocos datos usando fine-tuning condicionado por intención.
Descubre DiffusionGemma, el modelo de texto por difusión que genera bloques de 256 tokens en paralelo. Más rápido, bidireccional y ajustable en GPUs de consumo. Ideal para desarrolladores.
Un estudio revela que el ajuste fino con razonamiento sintético empeora la predicción de Alzheimer, a pesar de razonamientos precisos. Descubre por qué.
Descubre cómo el ajuste fino con LoRA y NEFTune potencia el rendimiento de DeepSeek-R1-8B en reconocimiento de entidades financieras, alcanzando un F1 de 0.912.
Aprende cómo un nuevo método de entrenamiento con programas probabilísticos mejora el razonamiento inductivo en LLMs, alineándolos con juicios humanos.
Aprende cómo MODIP optimiza políticas de difusión con modelos predictivos y control de trayectorias. Resultados superiores en D4RL y RoboMimic.
El entrenamiento secuencial de LLaMA supera a modelos 70B en calificación de ensayos: 87% F1 en conclusión y 65% en evidencia. Descubre cómo.
Descubre cómo el diseño de distribución objetivo revoluciona el ajuste fino supervisado de modelos de IA. Target-SFT optimiza la distribución y supera métodos tradicionales.