Alineación de Atención Enmascarada para Cuantización Sin Datos en ViTs
Descubre cómo MaskAQ utiliza alineación de atención enmascarada para cuantizar Vision Transformers sin datos reales, mejorando la seguridad y el rendimiento.
Descubre cómo MaskAQ utiliza alineación de atención enmascarada para cuantizar Vision Transformers sin datos reales, mejorando la seguridad y el rendimiento.
Descubre cómo el nuevo método de replay priorizado por ventaja mejora la eficiencia muestral en GRPO para LLMs, logrando +4.35% en benchmarks.
Nuevo algoritmo DNSGD: optimización descentralizada no convexa con suavidad (L0,L1). Logra punto estacionario con menor complejidad. ¡Descúbrelo!
Aprende cómo la autoevaluación por clusters permite a los LLMs medir su incertidumbre con solo dos muestras, mejorando la confiabilidad de sus respuestas.
Descubre cómo aceleración GPU 30,000x y Transformers entrenan flotas de vehículos autónomos para seguimiento acústico submarino con errores <5m.
Descubre cómo Aletheia revela la receta óptima para entrenar verificadores de código según la escala del modelo. Ahorra costos sin sacrificar precisión.
Reduce correlaciones espurias con un método de dos etapas basado en memorización. Solo 10% de datos, un modelo ERM supera a técnicas de debiasing ¡Descúbrelo!
¿Más datos siempre mejoran el aprendizaje multitarea? Un nuevo estudio demuestra que no. Conoce los límites insuperables de la adaptación y el teorema de no-free-lunch.
Descubre el aprendizaje supervisado como compresión con pérdida: análisis de bloque finito para generalización y complejidad de muestra.
Descubre cómo el Conformal C2ST convierte clasificadores débiles en potentes pruebas de dos muestras para validar modelos de inferencia bayesiana.
MulFeRL mejora el aprendizaje por refuerzo usando retroalimentación verbal en múltiples turnos para superar recompensas escalares y potenciar el razonamiento.
Descubre cómo los algoritmos de AutoEval usan datos sintéticos para reducir costos de anotación humana y aumentar la muestra efectiva hasta un 50% con GPT-4.
La mediana de estadísticos U incompletos (MIU) ofrece un estimador robusto con tasas de concentración en muestras finitas para kernels simétricos.
Descubre los nuevos límites de convergencia no asintóticos para Engression y Reverse Markov Engression. Resultados casi óptimos para aprendizaje de distribuciones condicionales con redes profundas.
Estudio revela que un prior de simetría erróneo perjudica el aprendizaje más que no tenerlo. Además, aumento de datos con promediado iguala modelos equivariante
La alineación de características, no el tamaño de datos, determina la fusión: cross-attention vs concatenación. Estudio con CLIP y ResNet.
Descubre cómo la minimización de complejidad demuestra que el meta-aprendizaje escala con datos, mejorando la eficiencia en pocos ejemplos.
Mejora la precisión al estimar valores Shapley con pocas evaluaciones. ShaplEIG usa diseño bayesiano para selección adaptativa de coaliciones. Ideal para costos.
Aprende sobre el nuevo protocolo para aprendizaje eficiente de Hamiltonianos de estados Gaussianos usando mediciones heterodinas e inversión local.
Descubre cómo los límites de error basados en la complejidad de Rademacher permiten controlar la generalización en computación cuántica de reservorios, incluso con escalamiento exponencial de qubits.