Olvidar no es borrar: Claves de transporte recuperan conocimiento
El olvido catastrófico no borra conocimiento, solo desalinea interfaces. Descubre cómo claves de transporte recuperan conocimiento latente en IA.
El olvido catastrófico no borra conocimiento, solo desalinea interfaces. Descubre cómo claves de transporte recuperan conocimiento latente en IA.
Descubre el marco Epi-LLM, que combina modelos de lenguaje y agentes sintéticos para simular comportamientos humanos durante epidemias, comparando con datos rea
ALAR reduce hasta un 84.6% los tokens en agentes LLM, usando razonamiento latente en rutina y explícito solo cuando es necesario. Eficiencia y precisión mejoradas.
El reward hacking en difusión proviene de la estimación finita de la función h. Proponemos una corrección sin costo y aclaramos el best-of-n.
Mejora la predicción de clima extremo con NTK-UQ: intervalos 31-37% más precisos, adaptativos y sin reentrenamiento.
¿Las sondas lineales detectan razonamiento o formato? Un estudio revela que la precisión en LLMs se explica por confusores de formato, no por modos de razonamie
Fast-dLLM++ acelera inferencia de LLM difusivos sin modificar modelo, aprovechando confianza heterogénea para lograr 37% más rendimiento sin perder precisión.
Descubre cómo Echelon permite adaptar modelos de lenguaje entre organizaciones sin exponer datos, usando solo agregados auditables.
Descubre TypewriterLM, un modelo de lenguaje de 7.24B parámetros entrenado con textos anteriores a 1913. Supera desafíos de calidad y fuga temporal.
Descubre cómo Patcher repara modelos de lenguaje con puertas traseras usando solo un fallo reportado. Defensa práctica contra ataques de entrenamiento.
La cuantización no destruye todas las características interpretables: un análisis revela que el 62% persiste en INT6, pero las métricas engañan.
Potencia MLLMs con MUSE, un arnés agéntico unificado que mejora tareas complejas sin reentrenar, usando verificación y reparación guiada.
Descubre cómo el nuevo método DCO alinea el manifold semántico en LLMs para reducir alucinaciones, mejorando la fidelidad contextual sin sacrificar conocimiento.
La inferencia INT8 consciente de picos acelera modelos spike en CPU, superando a TinyLlama con 22.63 tokens/s y reduciendo memoria.
Estudio empírico revela que ninguna representación molecular es universalmente mejor para LLMs. Descubre cuál usar según la tarea química.
Descubre cómo ASymPO optimiza el post-entrenamiento asíncrono de LLMs sin probabilidades de comportamiento, mejorando estabilidad y rendimiento.
Descubre cómo JF-HPO optimiza hiperparámetros en RL para LLMs, logrando hasta 14.9x más eficiencia y mejoras de rendimiento del 5.8% al 111.6%.
Descubre cómo COPSD logra un mejor equilibrio entre seguridad y utilidad en modelos de IA, reduciendo el costo de la seguridad en razonamiento general.
Prior Guidance (PG) y FMPG: mejora modelos puente de traducción de imágenes sin entrenamiento, usando guía previa y modulación de frecuencias. Ideal para inpainting.
Descubre un marco ligero de LLM con destilación y agregación logra un 98.25% de precisión en auditoría de contratos inteligentes, superando modelos grandes.