Tensorizando Engram: Latentes compartidos en N-gramas para LLMs
Descubre TN-gram: un módulo de memoria compacto que mejora LLMs al compartir factores latentes entre embeddings de N-gramas con menos parámetros.
Descubre TN-gram: un módulo de memoria compacto que mejora LLMs al compartir factores latentes entre embeddings de N-gramas con menos parámetros.
Los LLMs pueden ocultar secretos mediante esteganografía. La detección con sondas lineales se evade, pero se restaura con recontextualización.
Ejecutar dos LLMs en una Mini PC suena bien, pero los benchmarks revelan un cuello de botella de memoria que lo hace contraproducente.
El decreto de Trump sobre IA promete seguridad, pero ¿es solo un gesto vacío? Analizamos sus deficiencias y la realidad.
Estudio revela cómo el contexto modifica geométricamente las representaciones de verdad en LLMs. Cambios direccionales y de magnitud separan verdad de falsedad.
DyCP poda dinámicamente el contexto en diálogos extensos con LLMs, reduciendo costes de inferencia sin perder precisión. Optimiza tus modelos.
Descubre cómo ReD (Reset and Discard) mejora la inferencia de LLMs a presupuesto fijo, aumentando la cobertura de respuestas correctas y reduciendo costos en tokens y USD.
Descubre cómo Robust-U1 permite a los MLLMs auto-recuperar imágenes corruptas, mejorando la comprensión visual con aprendizaje por refuerzo y alcanzando resultados líderes.
Descubre cómo detectar alineación propietaria en modelos de lenguaje sin un estándar de referencia. Un marco comparativo para auditar sesgos y políticas ocultas.
EinSort: ordenando índices para tensorizar LLMs. Descubre estructuras de rango bajo y comprime pesos y KV-cache con mejor calidad. ¡Optimiza tus modelos!
Aprende cómo CAHL alinea planificador y ejecutor en LLMs con herramientas, mejorando el rendimiento en tareas complejas.
El ajuste por instrucciones mejora la comprensión de comandos pero perjudica la finalización de código en flujo. Conoce el 'impuesto' oculto.
TheoremBench evalúa LLMs en Lean4 con teoremas clásicos y subteoremas. Mide cobertura y eficiencia para revelar debilidades en razonamiento formal.
Los grafos de conocimiento y LLMs con RL logran predecir perturbaciones transcriptómicas con alta precisión, superando a métodos complejos. Descubre cómo.
SearchSwarm logra 68.1 en BrowseComp y 73.3 en BrowseComp-ZH, superando a modelos de su escala. Descubre cómo entrena la inteligencia de delegación.
Descubre ABLE: representa y compara LLMs con atribuciones de gradientes sin entrenamiento. Ideal para selección de modelos y auditoría de seguridad.
Descubre cómo los LLMs construyen grafos causales implícitos desde texto con descubrimiento de cadenas y sabiduría de masas. Evaluado con 1,560 pares.
El post-entrenamiento actual de LLMs es en realidad un ajuste fino masivo. ¿Estamos retrocediendo a métodos antiguos? Descúbrelo.
CAPruner optimiza la poda de grafos de escena para potenciar el razonamiento espacial 3D de LLMs, reduciendo costos y mejorando precisión.
Evaluamos prompts avanzados en Gemini Flash para QA biomédica. Un prompt complejo logró 0.720, superando al básico (0.565). El diseño de prompts es clave.