Predecir y Reconstruir: Objetivos Conjuntos para Representaciones de Lenguaje
Descubre cómo la combinación de JEPA y MLM mejora representaciones de lenguaje: embeddings más uniformes y semánticos. Un nuevo enfoque híbrido para NLP.
Descubre cómo la combinación de JEPA y MLM mejora representaciones de lenguaje: embeddings más uniformes y semánticos. Un nuevo enfoque híbrido para NLP.
Descubre cómo la diversidad geográfica en imágenes de IA revela sesgos: modelos antiguos más diversos y riesgo de estereotipos.
InfoShield minimiza la exposición de datos sensibles en análisis de voz para salud mental, reduciendo inferencia de género y edad con mínima pérdida de precisión.
Nuevo ataque adversario en ASR evade defensas al perturbar representaciones SSL, mejorando la transferibilidad como en Whisper.
Descubre GeoVR, un nuevo enfoque que enseña a los modelos multimodales a comprender el espacio 3D usando solo videos 2D. Resultados estatales del arte en razonamiento espacial.
Descubre cómo F3-Tokenizer domina los latentes de audio para mejorar tanto la comprensión como la generación, unificando ambos campos en un solo tokenizador.
LatentWave: modelo base inalámbrico con preentrenamiento JEPA. Aprende representaciones latentes transferibles para clasificación, posicionamiento y predicción.
Los modelos de difusión de video codifican la física internamente. Descubre cómo superan a métodos especializados en plausibilidad física.
Descubre cómo PRIG localiza la ambigüedad oculta en prompts de LLMs usando atribución por sonda, superando a GPT-5.4 en identificación de ambigüedad.
Un nuevo método Monte Carlo para estimar operadores volumétricos acelera el procesamiento de geometría 3D, robusto ante mallas de baja calidad y múltiples componentes.
Descubre cómo la inferencia bayesiana aprende representaciones causales discretas a partir de encuestas sociales en distintos dominios.
Descubre HOPSE: codificador de alto orden que escala en aprendizaje topológico, superando a métodos tradicionales.
HOPSE ofrece codificación posicional y estructural escalable para aprendizaje topológico, superando a la propagación de mensajes en velocidad y precisión.
Descubre cómo Concept-SAE controla conceptos específicos en modelos de IA, mejorando interpretabilidad y detección adversarial.
Descubre cómo las representaciones espectrales mejoran la escalabilidad y validez en pruebas de independencia condicional. Un enfoque innovador con garantías teóricas.
Descubre cómo las representaciones gaussianas isotrópicas mejoran la estabilidad en aprendizaje por refuerzo profundo, reduciendo colapso de representación y neuronas inactivas.
Descubre cómo SOLARIS acelera la inferencia de modelos fundacionales con descarga especulativa, logrando un 0.67% de aumento en ingresos en Meta.
MR.Q demuestra que las representaciones predictivas escalan el RL multitarea sin planificación, superando a modelos del mundo.
Cómo el fenómeno Grokking separa el ajuste de datos de la simplificación de representaciones con dos relojes de entrenamiento. Teoría de redes lineales y ReLU.
Teoría de alta dimensión para ajuste fino LoRA en atención. Descubre cómo el pre-entrenamiento afecta el error de prueba y la alineación. Ideal para optimizar modelos.