Diferentes capas, diferentes variedades: geometría del espacio de pesos en transformers
Descubre cómo la asignación específica de geometría de pesos (Stiefel en atención, DGram en MLP) mejora la optimización de transformers. Resultados con GPT-2.
Descubre cómo la asignación específica de geometría de pesos (Stiefel en atención, DGram en MLP) mejora la optimización de transformers. Resultados con GPT-2.
SGR-BIM automatiza verificación de normativas geométricas en BIM con razonamiento de grafos, alcanzando 84.3% de precisión en seguridad contra incendios.
La geometría del espacio de parámetros no predice la interferencia al combinar adaptadores en LLMs. Análisis con DoRA-RBAC y benchmarks de QA.
OmniLoc: modelo fundacional para localización sin anclas en interiores, con precisión geométrica y Transformer. Descubre cómo supera a métodos existentes.
OmniLoc: modelo fundacional geométrico para localizar dispositivos sin anclas en interiores. Supera variaciones de entorno y mejora precisión.
Descubre cómo ICALens usa ICA para encontrar direcciones interpretables en LLMs sin entrenar diccionarios, superando a los SAEs en eficiencia y sondas.
La oclusión demuestra que la geometría potencia la memoria espacial en agentes de lenguaje. Estudio revela mejora del 32% frente al enfoque lineal. ¡Lee más!
Aprende cómo la compresión suficiente para la acción optimiza decisiones robustas con tasa-arrepentimiento en un ciclo. Clave para IA y ciberseguridad.
Descubre cómo Bitcoin repitió su geometría en dos ciclos alcistas pese a noticias globales opuestas. Un análisis estadístico revela una correlación del 0.94.
Dos ciclos alcistas de Bitcoin con eventos opuestos muestran una correlación del 0.92. La geometría supera a los titulares. Descúbrelo.
Incrusta sistemas híbridos en campos vectoriales continuos para optimización diferenciable. Neural ODE latente supera alternativas en aprendizaje de series temporales.
Descubre cómo el aprendizaje por refuerzo con el Transformer de Polígonos supera a los solvers heurísticos en anidamiento irregular 2D, alcanzando una utilizaci
Descubre cómo un nuevo enfoque de aprendizaje por refuerzo con atención geométrica supera a los solucionadores heurísticos tradicionales en el anidamiento irregular 2D.
Los modelos de lenguaje codifican un espectro de conciencia en sus representaciones, formando un manifold navegable. Clave para la alineación de IA.
Descubre SPDM, un modelo con restricciones de variedad para pronóstico preciso y eficiente de series temporales.
GeoABC reduce un 38% el error cerca de la pared en simulaciones aerodinámicas. Conoce este marco de corrección anisotrópica de límites.
La geometría hiperbólica en neuronas del hipocampo mejora memoria y decodificación. Descubre su impacto en redes Hopfield.
Descubre cómo los transformers separan respuestas correctas de incorrectas mediante una dinámica rotacional en sus capas ocultas. Un estudio revela patrones geométricos sorprendentes.
La inflación de varianza en los bordes de dominios acotados genera sesgo en la adquisición de procesos gaussianos, afectando la optimización bayesiana.
Las redes ReLU generan regiones lineales. El grado promedio de su grafo está acotado por el doble de la dimensión de entrada y su diámetro es independiente.