El rol de la alineación de la retroalimentación en la autodestilación
Descubre cómo la retroalimentación alineada por pasos mejora la autodestilación, superando a GRPO en 16 puntos y a la solución de referencia en 5.
Descubre cómo la retroalimentación alineada por pasos mejora la autodestilación, superando a GRPO en 16 puntos y a la solución de referencia en 5.
UniTok convierte series temporales en tokens para modelos fundacionales. Permite pronóstico zero-shot, generación y clasificación sin entrenamiento.
Descubre Engram, el motor de memoria bi-temporal open-source que supera al historial completo: 83.6% de precisión con solo 9.6k tokens. Ideal para agentes LLM.
GitLab Orbit: grafo en vivo de código y ciclo de vida. Agentes de IA reducen errores y ahorran tokens. Prueba la beta pública.
DLA optimiza la atención en LLMs fusionando estados dinámicamente, reduciendo errores y manteniendo rendimiento en contextos largos.
Descubre cómo DeLM escala el razonamiento de LLMs con agentes descentralizados y contexto compartido, mejorando rendimiento en SWE-bench y LongBench y reduciendo costos un 50%.
Mejora la extracción de frases clave en documentos largos con expansión de atención. Resultados F1 superiores sin LLMs costosos.
Descubre Pose-ICL, un nuevo método de IA que permite controlar la pose de objetos personalizados en generación de imágenes con alta precisión y consistencia.
Descubre cómo PCAF revoluciona el modelado de lenguaje con memoria dispersa paralela, logrando mayor velocidad y eficiencia que transformers tradicionales. ¡Lee más!
Descubre PCAF, un novedoso modelo de memoria dispersa que acelera el procesamiento de lenguaje con contexto largo, superando a Transformers en velocidad y perplejidad.
Descubre cómo Express convierte aproximaciones de atención no causal en causales, reduciendo memoria y mejorando velocidad en modelos de lenguaje.
Express optimiza atención causal, supera a FlashAttention 2. Reduce cuellos de botella de memoria, cómputo y compresión KV en modelado de lenguaje.
Descubre cómo los priores estructurales no paramétricos y los grafos de precedencia permiten a los LLMs predecir teoremas geométricos con un 89.29% de precisión, superando modelos supervisados.
LWM-Planner: planificación anticipada con hechos para agentes LLM. Extrae hechos de experiencias, simula el mundo y mejora decisiones sin ajustes de parámetros.
La personalidad percibida varía según el contexto laboral. El estrés afecta al neuroticismo; la acústica predice rasgos en roles diádicos.
¿Pueden los LLMs proteger tu privacidad cuando otros comparten tus datos? IDP-Bench lo mide.
El humano en el bucle mejora respuestas de entrevista: más confianza y autenticidad con menos iteraciones que la IA iterativa.
Los certificados finitos verifican la determinación contextual en LLMs y separan emergencia real de artefactos métricos. Nuevo marco teórico.
Still comprime el caché KV en una sola pasada, reduciendo memoria en modelos de lenguaje sin perder calidad. Ideal para contextos largos.
CAAL usa bandidos contextuales para seleccionar dinámicamente estrategias de aprendizaje activo basadas en contexto externo.