HOPSE: Codificador de Posición y Estructura para Representaciones de Alto Orden
HOPSE ofrece codificación posicional y estructural escalable para aprendizaje topológico, superando a la propagación de mensajes en velocidad y precisión.
HOPSE ofrece codificación posicional y estructural escalable para aprendizaje topológico, superando a la propagación de mensajes en velocidad y precisión.
Descubre cómo Concept-SAE controla conceptos específicos en modelos de IA, mejorando interpretabilidad y detección adversarial.
Descubre cómo las representaciones espectrales mejoran la escalabilidad y validez en pruebas de independencia condicional. Un enfoque innovador con garantías teóricas.
Descubre cómo las representaciones gaussianas isotrópicas mejoran la estabilidad en aprendizaje por refuerzo profundo, reduciendo colapso de representación y neuronas inactivas.
Descubre cómo SOLARIS acelera la inferencia de modelos fundacionales con descarga especulativa, logrando un 0.67% de aumento en ingresos en Meta.
MR.Q demuestra que las representaciones predictivas escalan el RL multitarea sin planificación, superando a modelos del mundo.
Cómo el fenómeno Grokking separa el ajuste de datos de la simplificación de representaciones con dos relojes de entrenamiento. Teoría de redes lineales y ReLU.
Teoría de alta dimensión para ajuste fino LoRA en atención. Descubre cómo el pre-entrenamiento afecta el error de prueba y la alineación. Ideal para optimizar modelos.
Las explicaciones contrafactuales revelan qué características diferencian dos grupos en pruebas de hipótesis con deep learning. Un método basado en MMD y autoen
Descubre cómo las representaciones Bayes-suficientes preservan la información relevante para la predicción óptima. Incluye experimentos con iNaturalist.
Descubre cómo los embeddings simpliciales mejoran la eficiencia muestral en Actor-Critic, acelerando el entrenamiento sin pérdida. Resultados: TD3, SAC, PPO.
Descubre TamperBench, el primer marco unificado para evaluar la resistencia de LLMs a manipulaciones y ajustes finos. Resultados clave y código abierto.
Descubre cómo un currículo de RL permite a LLMs generalizar procedimientos entre código y lenguaje natural, igualando a GPT-4o.
El model stitching ya no es solo un diagnóstico: descubre cómo unir modelos de visión heterogéneos para mejorar precisión y eficiencia en LLMs multimodales.
KODA compara y alinea representaciones de modelos visión-lenguaje como CLIP y SigLIP usando kernels. Identifica discrepancias estructurales interpretables.
EMTC mejora la consistencia temporal en memoria episódica para MARL cooperativo, superando cuellos de botella y logrando hasta un 28% de mejora en benchmarks.
Descubre cómo la identificabilidad de neuronas permite fusionar representaciones sin alineación previa, revelando nuevas conexiones en el deep learning.
La pérdida no basta en aprendizaje contrastivo. Condiciones de muestreo y sesgo inductivo determinan la recuperación de representaciones latentes.
Descubre RePercENT, un marco auto-supervisado que escala el desenredo de representaciones a múltiples modalidades sin pre-entrenamiento, reduciendo costos computacionales.
PointAction transforma videos en acciones robóticas precisas usando puntos 3D dinámicos. Descubre cómo este marco reduce la ambigüedad y generaliza entre tareas y robots.