Cerrando el bucle del razonamiento latente con reconstrucción en tiempo de prueba
Descubre cómo ReLAT cierra el bucle del razonamiento latente usando reconstrucción en tiempo de prueba, mejorando precisión en matemáticas un 73.3% en AIME 2024
Descubre cómo ReLAT cierra el bucle del razonamiento latente usando reconstrucción en tiempo de prueba, mejorando precisión en matemáticas un 73.3% en AIME 2024
La validación cruzada puede fallar al comparar modelos incluso estables como Lasso. Aprende por qué esta inestabilidad relativa invalida las inferencias.
PJ-RoPE unifica RoPE, Jordan-RoPE y ALiBi en un espacio aprendible. Mejora la estabilidad y la precisión en tareas de lenguaje y música.
Descubre cómo BiasGRPO estabiliza la mitigación de sesgos con optimización grupal relativa, superando a DPO y PPO en benchmarks.
Aprende cómo los Transformers Platónicos ofrecen equivarianza geométrica sin sobrecarga computacional, ideal para visión, nubes de puntos y química.
Descubre HUNT, el sistema que permite a drones navegar a alta velocidad y seguir objetivos en entornos sin GPS ni estructuras. Ideal para búsqueda y rescate.
Estudio revela que un prior de simetría erróneo perjudica el aprendizaje más que no tenerlo. Además, aumento de datos con promediado iguala modelos equivariante
Descubre ReFLEX, Transformer que elimina ruido CSI en MIMO-OFDM con asignaciones RB variables, mejorando el BLER en 2-3 dB en canales 3GPP sin reentrenamiento.
Descubre CRePE, método de poda post-entrenamiento para LLMs que reduce costos sin perder precisión, y PHO que acelera la búsqueda de hiperparámetros.
Descubre cómo mejorar la comunicación entre modelos de IA con anclajes semánticos y métricas geométricas. Logra transferencia casi sin pérdida de información.