Escalando Agentes Auto-Evolutivos con Memoria Paramétrica
Marco TMEM: agentes IA auto-evolutivos con memoria paramétrica y LoRA. Aprenden de la experiencia, mejorando su comportamiento sin reinicios.
Marco TMEM: agentes IA auto-evolutivos con memoria paramétrica y LoRA. Aprenden de la experiencia, mejorando su comportamiento sin reinicios.
Descubre cómo la coincidencia de correlaciones temporales con restricciones físicas mejora la eficiencia de búsqueda. Un modelo minimalista revela el principio organizador.
Descubre AgenticDiffusion: un marco que combina razonamiento lingüístico, visión multiángulo y difusión para lograr un 80% de éxito en navegación UAV en interiores.
Descubre cómo los LLMs traducen requisitos de misión en código de optimización de trayectorias para misiones espaciales más seguras y eficientes.
Recover-LoRA recupera hasta 95% de precisión en modelos de 2 bits usando adaptación de bajo rango y destilación con solo 10k datos sintéticos.
Recover-LoRA recupera hasta un 95% de precisión en modelos de lenguaje cuantizados a 2 bits usando destilación de conocimiento con datos sintéticos. Ideal para despliegue en edge.
Descubre cómo modelos de lenguaje usan adaptadores LoRA como herramientas dinámicas, con 98.3% precisión al enrutar y mejoras 84 puntos en tareas específicas.
Los adaptadores LoRA como herramientas modulares logran un 98.3% de precisión en enrutamiento y ganancias de hasta +84 puntos porcentuales en agentes de IA.
Descubre cómo el nuevo CCDM permite personalizar modelos de difusión sin olvidar conceptos previos, mejorando la coherencia en la síntesis multi-concepto.
Exploración aleatoria (Thompson sampling) logra arrepentimiento óptimo en bandidos lineales con espacios convexos. ¡Un avance clave!
Guía para lograr razonamiento eficiente de LLM en dispositivos de borde. Usamos LoRA, ajuste fino y refuerzo para reducir tokens y latencia sin perder precisión.
Descubre cómo la Máquina Neural de Langevin usa reglas locales asimétricas para generar imágenes creativas y eliminar ruido, con aplicaciones biológicas.
Descubre ContactExplorer, un método que usa cobertura de contacto para guiar la exploración en manipulación diestra, mejorando eficiencia y tasa de éxito en tareas complejas.
Descubre cómo Policy Split mejora la exploración dual en LLMs con regularización de entropía para mayor precisión y creatividad.
Descubre cómo nuestro algoritmo combina datos offline y exploración online en bandidos lineales para minimizar el arrepentimiento. Resultados empíricos demuestran su eficacia.
Descubre cómo BayesWarp mejora el testing de redes neuronales, descubriendo fallos diversos con cercanía a datos originales. Aumenta fiabilidad.
Mejora el algoritmo MADDPG con inferencia de acciones y muestreo por importancia para optimizar la cooperación y exploración en entornos multiagente.
RowNet es un transformer de memoria que mejora la valoración inmobiliaria al recuperar propiedades comparables. Descubre su arquitectura.
IGA alinea gradientes en ejemplos lógicamente isomorfos para destilar razonamiento robusto en LLMs, con hasta 14.3% más precisión y 4x consistencia lógica.
Descubre cómo Suno, el generador de música con IA, recauda $400 millones a pesar de las demandas por derechos de autor. Su valoración alcanza $5.4B.