#llms

Tensorizando Engram: Latentes compartidos en N-gramas para LLMs

Descubre TN-gram: un módulo de memoria compacto que mejora LLMs al compartir factores latentes entre embeddings de N-gramas con menos parámetros.

2026-06-09 · 2 min

Ahora me ves: Detectando esteganografía evasiva en LLMs

Los LLMs pueden ocultar secretos mediante esteganografía. La detección con sondas lineales se evade, pero se restaura con recontextualización.

2026-06-09 · 2 min

Ejecutar dos LLMs en una Mini PC suena genial hasta que llegan los benchmarks

Ejecutar dos LLMs en una Mini PC suena bien, pero los benchmarks revelan un cuello de botella de memoria que lo hace contraproducente.

2026-06-09 · 2 min

La nueva orden de IA de Trump: las alucinaciones no son solo para LLMs

El decreto de Trump sobre IA promete seguridad, pero ¿es solo un gesto vacío? Analizamos sus deficiencias y la realidad.

2026-06-09 · 1 min

Transformaciones geométricas de la verdad en LLMs según el contexto

Estudio revela cómo el contexto modifica geométricamente las representaciones de verdad en LLMs. Cambios direccionales y de magnitud separan verdad de falsedad.

2026-06-09 · 1 min

DyCP: Podado Dinámico de Contexto para Diálogos Extensos con LLMs

DyCP poda dinámicamente el contexto en diálogos extensos con LLMs, reduciendo costes de inferencia sin perder precisión. Optimiza tus modelos.

2026-06-09 · 1 min

ReD: mejora la inferencia de LLMs con presupuesto fijo

Descubre cómo ReD (Reset and Discard) mejora la inferencia de LLMs a presupuesto fijo, aumentando la cobertura de respuestas correctas y reduciendo costos en tokens y USD.

2026-06-09 · 2 min

¿Pueden los MLLMs auto-recuperar contenido visual corrupto?

Descubre cómo Robust-U1 permite a los MLLMs auto-recuperar imágenes corruptas, mejorando la comprensión visual con aprendizaje por refuerzo y alcanzando resultados líderes.

2026-06-09 · 2 min

Auditoría de alineación propietaria en LLMs

Descubre cómo detectar alineación propietaria en modelos de lenguaje sin un estándar de referencia. Un marco comparativo para auditar sesgos y políticas ocultas.

2026-06-09 · 1 min

EinSort: Solo ordenar para tensorizar LLMs

EinSort: ordenando índices para tensorizar LLMs. Descubre estructuras de rango bajo y comprime pesos y KV-cache con mejor calidad. ¡Optimiza tus modelos!

2026-06-09 · 3 min

Aprendizaje Jerárquico Alineado a Capacidades para LLMs con Herramientas

Aprende cómo CAHL alinea planificador y ejecutor en LLMs con herramientas, mejorando el rendimiento en tareas complejas.

2026-06-09 · 2 min

El Impuesto del Ajuste por Instrucciones en LLMs para Código

El ajuste por instrucciones mejora la comprensión de comandos pero perjudica la finalización de código en flujo. Conoce el 'impuesto' oculto.

2026-06-09 · 3 min

TheoremBench: Evaluación de LLMs en demostración de teoremas matemáticos formales

TheoremBench evalúa LLMs en Lean4 con teoremas clásicos y subteoremas. Mide cobertura y eficiencia para revelar debilidades en razonamiento formal.

2026-06-09 · 2 min

Predictores simples de perturbaciones transcriptómicas con grafos y LLMs

Los grafos de conocimiento y LLMs con RL logran predecir perturbaciones transcriptómicas con alta precisión, superando a métodos complejos. Descubre cómo.

2026-06-09 · 1 min

SearchSwarm: Delegación inteligente en LLMs para investigación profunda

SearchSwarm logra 68.1 en BrowseComp y 73.3 en BrowseComp-ZH, superando a modelos de su escala. Descubre cómo entrena la inteligencia de delegación.

2026-06-09 · 2 min

ABLE: Representación de LLMs mediante incrustación por atribuciones

Descubre ABLE: representa y compara LLMs con atribuciones de gradientes sin entrenamiento. Ideal para selección de modelos y auditoría de seguridad.

2026-06-09 · 3 min

Construcción de grafos causales implícitos mediante descubrimiento de cadenas

Descubre cómo los LLMs construyen grafos causales implícitos desde texto con descubrimiento de cadenas y sabiduría de masas. Evaluado con 1,560 pares.

2026-06-09 · 2 min

Post-entrenamiento: aprendizaje supervisado masivo

El post-entrenamiento actual de LLMs es en realidad un ajuste fino masivo. ¿Estamos retrocediendo a métodos antiguos? Descúbrelo.

2026-06-09 · 2 min

CAPruner: Podador de Grafos de Escena para Razonamiento Espacial 3D en LLMs

CAPruner optimiza la poda de grafos de escena para potenciar el razonamiento espacial 3D de LLMs, reduciendo costos y mejorando precisión.

2026-06-09 · 3 min

Evaluación de prompting avanzado en Gemini Flash para QA biomédica multi-salto

Evaluamos prompts avanzados en Gemini Flash para QA biomédica. Un prompt complejo logró 0.720, superando al básico (0.565). El diseño de prompts es clave.

2026-06-09 · 2 min