SEFT: Ajuste fino disperso para LLMs con evolución de la dispersión
Descubre SEFT, un método de ajuste fino que permite a los LLMs dispersos evolucionar su estructura manteniendo eficiencia. Supera a métodos existentes.
Descubre SEFT, un método de ajuste fino que permite a los LLMs dispersos evolucionar su estructura manteniendo eficiencia. Supera a métodos existentes.
PieArena mide la capacidad de negociación de los LLMs en escenarios reales. GPT-5 iguala o supera a humanos en este benchmark.
Descubre cómo el benchmark REL evalúa el razonamiento relacional en LLMs, revelando sus limitaciones en tareas de alta aridad en ciencias.
Descubre cómo EvoOR-Agent utiliza la coevolución de arquitecturas de agentes y razonamiento interpretable para optimizar procesos complejos con LLMs. Mejora el rendimiento y la interpretabilidad.
Descubre Align-KD, técnica que destila conocimiento de alineación multimodal de VLMs grandes a modelos móviles, mejorando precisión en 6 benchmarks.
Los LLMs tienden a modernizar textos históricos. Descubre cómo el marco HAV con sistemas multiagente restaura la precisión documental. Lee más.
Aprende cómo SeSE cuantifica la incertidumbre en LLMs usando teoría estructural para evitar alucinaciones. Mejora la fiabilidad de tus modelos.
Descubre cómo la linealidad relacional en modelos de lenguaje predice alucinaciones. Un nuevo estudio revela claves para entender fallos en IA.
Descubre cómo los LLMs optimizan planes de consulta física en tiempo de prueba, logrando aceleraciones de hasta 4.78x en consultas OLAP. ¡Aumenta la eficiencia!
Habilidades modulares para LLMs: arquitectura, adquisición y seguridad. 26% de habilidades tienen vulnerabilidades. Marco de confianza propuesto. ¡Futuro de agentes!
KnapSpec acelera inferencia LLMs hasta 1.47x sin entrenamiento. Selecciona capas adaptativas como problema mochila. Optimiza rendimiento en secuencias.
Descubre DECA, el ajuste fino completo descentralizado para LLMs con Adam por bloques y datos no IID.
Descubre cómo el momento en Muon filtra el ruido del gradiente, mejorando el entrenamiento de LLMs. Un análisis teórico con respaldo experimental.
El Adversarial ML para LLMs no progresa: problemas vagos, complejos y difíciles de medir. Conoce las razones y el riesgo de una década perdida.
Descubre MuLoCo, el optimizador con Muon que supera a DiLoCo, permite mayores batch sizes y mejor escalabilidad en entrenamiento de modelos de lenguaje.
Descubre GRZO, el optimizador que reduce la varianza en el ajuste fino de LLMs, mejorando precisión y ahorrando memoria GPU.
Potencia MLLMs con MUSE, un arnés agéntico unificado que mejora tareas complejas sin reentrenar, usando verificación y reparación guiada.
Estudio empírico revela que ninguna representación molecular es universalmente mejor para LLMs. Descubre cuál usar según la tarea química.
Descubre cómo ASymPO optimiza el post-entrenamiento asíncrono de LLMs sin probabilidades de comportamiento, mejorando estabilidad y rendimiento.
Dos nuevas métricas detectan sobreuso léxico y cambios de preferencia en LLMs sin supervisión manual. Resultados del estudio.