Método corrige localización de circuitos con retropropagación consciente
Aprende cómo GIM, un nuevo método de retropropagación, mejora la localización de circuitos en modelos de lenguaje al tener en cuenta interacciones.
Aprende cómo GIM, un nuevo método de retropropagación, mejora la localización de circuitos en modelos de lenguaje al tener en cuenta interacciones.
Descubre por qué la optimización es clave en el aprendizaje off-policy con grandes espacios de acción, y cómo los pesos de verosimilitud simplifican el proceso.
Nuevo marco OncoReason alinea LLMs con razonamiento clínico para predicción de supervivencia robusta e interpretable. Mejora F1 un 6% y reduce MAE un 12%.
SmartThinker calibra la longitud de cadena de pensamiento logrando hasta 52.5% de compresión y mejora de precisión en modelos de lenguaje grandes.
Descubre CRAFT, un marco que replica expertos con granularidad fina para mejorar el rendimiento de modelos MoE hasta un 20% sin modificar el modelo.
Por primera vez, se demuestran cotas de generalización no triviales para redes profundas sin modificaciones, incluso con 600M parámetros. Análisis basado en la geometría de los datos.
Descubre RefLoRA, una nueva técnica de fine-tuning que acelera la convergencia y mejora el rendimiento de modelos grandes con mínimo costo computacional.
Descubre cómo NeVA alinea valores en LLMs con edición neuronal, evitando fugas indeseadas. Control fino sin reentrenamiento.
Descubre cómo el autoencoder disperso a nivel de paso (SSAE) desentraña el razonamiento de los LLMs, revelando información sobre corrección y lógica. Ideal para interpretabilidad en IA.
Un método innovador con autoencoders revela brechas ocultas en LLMs y benchmarks. Mejora la evaluación de modelos de IA identificando conceptos débiles.
Descubre ELF, una familia de modelos ECG-Lenguaje sin codificador que supera a modelos complejos con arquitecturas más simples. ¡Resultados impresionantes!
Mujeres transforman sus bolsos en ciberdecks brillantes para protestar contra el poder de las grandes tecnológicas. Una forma divertida de resistencia digital.
PiEvo revoluciona el descubrimiento científico al hacer evolucionar principios con IA. Logra un 31% más de calidad y un 83% de aceleración en la convergencia. Descúbrelo.
TrOPD estabiliza la destilación on-policy de LLMs usando regiones de confianza, superando la divergencia profesor-alumno. Mejora razonamiento, código y benchmarks.
TrOPD estabiliza la destilación on-policy en LLMs con regiones de confianza. Supera a OPD, EOPD y REOPOLD en razonamiento y código. ¡Descubre cómo!
Descubre CRePE, método de poda post-entrenamiento para LLMs que reduce costos sin perder precisión, y PHO que acelera la búsqueda de hiperparámetros.
Descubre cómo el algoritmo semi-relajado de Gromov-Wasserstein permite estimar la estructura latente de redes masivas de forma eficiente, con garantías de consistencia y convergencia óptima.
Descubre cómo los picos masivos en LLMs son vectores de sesgo y cómo la cuantización sin picos revoluciona la eficiencia de los modelos de IA. ¡Optimiza tu AI!
Descubre cómo los gradientes semánticos revelan la incertidumbre de los LLM. SemGrad y HybridGrad: métodos sin muestreo para predicciones fiables.
Descubre cómo nuevas aproximaciones discretas a SGLD permiten cuantificar incertidumbre en grandes conjuntos de datos para mejor ajuste y robustez.