#muestra

Alineación de Atención Enmascarada para Cuantización Sin Datos en ViTs

Descubre cómo MaskAQ utiliza alineación de atención enmascarada para cuantizar Vision Transformers sin datos reales, mejorando la seguridad y el rendimiento.

2026-06-04 · 2 min

Replay de experiencia a nivel de rollout para GRPO

Descubre cómo el nuevo método de replay priorizado por ventaja mejora la eficiencia muestral en GRPO para LLMs, logrando +4.35% en benchmarks.

2026-06-04 · 2 min

Optimización estocástica descentralizada no convexa bajo suavidad (L0,L1)

Nuevo algoritmo DNSGD: optimización descentralizada no convexa con suavidad (L0,L1). Logra punto estacionario con menor complejidad. ¡Descúbrelo!

2026-06-03 · 2 min

Autoevaluación Agrupada: Método Simple para Incertidumbre en LLMs

Aprende cómo la autoevaluación por clusters permite a los LLMs medir su incertidumbre con solo dos muestras, mejorando la confiabilidad de sus respuestas.

2026-06-03 · 3 min

Escalando MARL para Seguimiento Acústico Submarino con Vehículos Autónomos

Descubre cómo aceleración GPU 30,000x y Transformers entrenan flotas de vehículos autónomos para seguimiento acústico submarino con errores <5m.

2026-06-03 · 2 min

Aletheia: ¿Qué hace funcionar a RLVR para verificadores de código?

Descubre cómo Aletheia revela la receta óptima para entrenar verificadores de código según la escala del modelo. Ahorra costos sin sacrificar precisión.

2026-06-03 · 2 min

Reducir correlaciones espurias con de-sesgo guiado por memorización

Reduce correlaciones espurias con un método de dos etapas basado en memorización. Solo 10% de datos, un modelo ERM supera a técnicas de debiasing ¡Descúbrelo!

2026-06-03 · 3 min

Cuando más datos no ayudan: límites de la adaptación en aprendizaje multitarea

¿Más datos siempre mejoran el aprendizaje multitarea? Un nuevo estudio demuestra que no. Conoce los límites insuperables de la adaptación y el teorema de no-free-lunch.

2026-06-03 · 2 min

Aprendizaje supervisado como compresión con pérdida: generalización

Descubre el aprendizaje supervisado como compresión con pérdida: análisis de bloque finito para generalización y complejidad de muestra.

2026-06-03 · 2 min

Conformal C2ST: Convertir clasificadores débiles en pruebas de dos muestras

Descubre cómo el Conformal C2ST convierte clasificadores débiles en potentes pruebas de dos muestras para validar modelos de inferencia bayesiana.

2026-06-03 · 3 min

MulFeRL: Retroalimentación verbal para aprendizaje por refuerzo en multiturno

MulFeRL mejora el aprendizaje por refuerzo usando retroalimentación verbal en múltiples turnos para superar recompensas escalares y potenciar el razonamiento.

2026-06-03 · 2 min

AutoEval correcto: evaluar modelos con datos sintéticos

Descubre cómo los algoritmos de AutoEval usan datos sintéticos para reducir costos de anotación humana y aumentar la muestra efectiva hasta un 50% con GPT-4.

2026-06-03 · 2 min

Mediana de estadísticos U incompletos: estimador robusto

La mediana de estadísticos U incompletos (MIU) ofrece un estimador robusto con tasas de concentración en muestras finitas para kernels simétricos.

2026-06-02 · 2 min

Análisis teórico de Engression y Reverse Markov Engression

Descubre los nuevos límites de convergencia no asintóticos para Engression y Reverse Markov Engression. Resultados casi óptimos para aprendizaje de distribuciones condicionales con redes profundas.

2026-06-02 · 2 min

Midiendo la tasa de intercambio simetría-datos

Estudio revela que un prior de simetría erróneo perjudica el aprendizaje más que no tenerlo. Además, aumento de datos con promediado iguala modelos equivariante

2026-06-02 · 2 min

Alineación de características determina estrategia de fusión multimodal

La alineación de características, no el tamaño de datos, determina la fusión: cross-attention vs concatenación. Estudio con CLIP y ResNet.

2026-06-02 · 2 min

Ley de escalado de datos para meta-aprendizaje con minimización de complejidad

Descubre cómo la minimización de complejidad demuestra que el meta-aprendizaje escala con datos, mejorando la eficiencia en pocos ejemplos.

2026-06-02 · 2 min

ShaplEIG: Diseño Experimental Bayesiano para Estimar el Valor Shapley

Mejora la precisión al estimar valores Shapley con pocas evaluaciones. ShaplEIG usa diseño bayesiano para selección adaptativa de coaliciones. Ideal para costos.

2026-06-02 · 2 min

Aprendizaje eficiente de Hamiltonianos, estructura y traza de estados Gaussianos

Aprende sobre el nuevo protocolo para aprendizaje eficiente de Hamiltonianos de estados Gaussianos usando mediciones heterodinas e inversión local.

2026-06-02 · 2 min

Computación cuántica de reservorios y límites de riesgo

Descubre cómo los límites de error basados en la complejidad de Rademacher permiten controlar la generalización en computación cuántica de reservorios, incluso con escalamiento exponencial de qubits.

2026-06-02 · 2 min