Expresión fiel de confianza en modelos de razonamiento grandes
¿Los modelos de razonamiento grandes expresan su confianza de forma fiel? Cuantificamos la calibración entre incertidumbre interna y verbalizada, revelando desa
¿Los modelos de razonamiento grandes expresan su confianza de forma fiel? Cuantificamos la calibración entre incertidumbre interna y verbalizada, revelando desa
Descubre cómo las simetrías, la inferencia de políticas y la compresión de soluciones revolucionan la planificación con incertidumbre en IA.
¿Tus impresiones 3D tienen antiestéticas líneas? Descubre qué son las costuras y los mejores trucos para ocultarlas y lograr piezas perfectas.
Los signos de pesos inicializados persisten y crean un cuello de botella en compresión sub-bit. Descubre la teoría de bloqueo de signos y un nuevo método.
Analizamos el aprendizaje de características en destilación de conocimiento y presentamos Confusion Distillation, una auto-destilación eficiente que supera a otros métodos en 1.2%.
Descubre cómo la teoría geométrica explica el intercambio entre preservar observables físicos y la fidelidad de reconstrucción en compresión de datos científicos. Un nuevo diagnóstico de alineación.
Descubre cómo la geometría local explica el conflicto entre propiedades físicas y fidelidad en compresión con IA. Nuevo diagnóstico de alineación.
Descubre cómo fusionar múltiples LoRAs en un solo adaptador de bajo rango con Compress-then-Merge, mejorando eficiencia y rendimiento sin perder estructura.
Descubre TAGSAM, el método que condensa grafos con texto al 1% sin perder precisión y con un 4.9% más de exactitud. Optimiza tus modelos de IA.
Descubre VaSE, un método de evicción de caché KV que protege valores grandes y usa estocasticidad para mejorar precisión en modelos de razonamiento. Reduce memoria 4x sin perder rendimiento.
Descubre SEAOTTER, un innovador framework de compresión para robótica en la nube que combina autoencoders con JPEG, logrando 200:1 de compresión y 7x más velocidad que AVIF.
La cuantización no destruye todas las características interpretables: un análisis revela que el 62% persiste en INT6, pero las métricas engañan.
Aprende cómo PSViT comprime SViT con poda estructural: 22% menos memoria y alta precisión.
Descubre AdaCoM, un método de gestión de contexto adaptativo que mejora el rendimiento de agentes LLM en tareas largas, preservando restricciones y comprimiendo contenido obsoleto.
Descubre cómo la curvatura de grafos permite podar redes neuronales sin perder precisión. Técnica innovadora basada en Ollivier-Ricci para identificar conexiones clave.
Descubre cómo StiefAttention comprime el caché KV con aproximación de rango bajo en la variedad de Stiefel, mejorando precisión y eficiencia en modelos de lenguaje.
EntQuant comprime modelos de 70B parámetros en solo 10 minutos sin datos de calibración, alcanzando SOTA en compresión extrema a 2 bits con codificación de entropía.
Descubre el aprendizaje supervisado como compresión con pérdida: análisis de bloque finito para generalización y complejidad de muestra.
Descubre cómo TACO comprime datasets tabulares en espacio latente, logrando hasta 94x más rapidez y 97% menos memoria sin perder rendimiento.
Descubre cómo las extensiones del framework HiPPO ofrecen memoria adaptativa y asociativa en modelos de espacio de estado, manteniendo la interpretabilidad. Un