#presentaciones

Predecir y Reconstruir: Objetivos Conjuntos para Representaciones de Lenguaje

Descubre cómo la combinación de JEPA y MLM mejora representaciones de lenguaje: embeddings más uniformes y semánticos. Un nuevo enfoque híbrido para NLP.

2026-06-06 · 2 min

Diversidad geográfica en representaciones de IA en imágenes

Descubre cómo la diversidad geográfica en imágenes de IA revela sesgos: modelos antiguos más diversos y riesgo de estereotipos.

2026-06-06 · 1 min

InfoShield: Preservación de privacidad en detección de salud mental

InfoShield minimiza la exposición de datos sensibles en análisis de voz para salud mental, reduciendo inferencia de género y edad con mínima pérdida de precisión.

2026-06-06 · 2 min

Ataques adversarios en ASR más allá de la forma de onda

Nuevo ataque adversario en ASR evade defensas al perturbar representaciones SSL, mejorando la transferibilidad como en Whisper.

2026-06-06 · 2 min

GeoVR: Aprendizaje de representaciones geométricas para MLLM espaciales

Descubre GeoVR, un nuevo enfoque que enseña a los modelos multimodales a comprender el espacio 3D usando solo videos 2D. Resultados estatales del arte en razonamiento espacial.

2026-06-06 · 1 min

F3-Tokenizer: domando latentes de audio para entender y generar

Descubre cómo F3-Tokenizer domina los latentes de audio para mejorar tanto la comprensión como la generación, unificando ambos campos en un solo tokenizador.

2026-06-06 · 1 min

LatentWave: Preentrenamiento JEPA para modelos base inalámbricos

LatentWave: modelo base inalámbrico con preentrenamiento JEPA. Aprende representaciones latentes transferibles para clasificación, posicionamiento y predicción.

2026-06-06 · 1 min

La mano invisible de la física en modelos de difusión de video

Los modelos de difusión de video codifican la física internamente. Descubre cómo superan a métodos especializados en plausibilidad física.

2026-06-05 · 2 min

Localizando ambigüedad en prompts de LLM con atribución dirigida por sonda

Descubre cómo PRIG localiza la ambigüedad oculta en prompts de LLMs usando atribución por sonda, superando a GPT-5.4 en identificación de ambigüedad.

2026-06-05 · 2 min

Operadores Monte Carlo Steklov para geometría a gran escala

Un nuevo método Monte Carlo para estimar operadores volumétricos acelera el procesamiento de geometría 3D, robusto ante mallas de baja calidad y múltiples componentes.

2026-06-05 · 2 min

Representaciones causales discretas en dominios heterogéneos: enfoque bayesiano

Descubre cómo la inferencia bayesiana aprende representaciones causales discretas a partir de encuestas sociales en distintos dominios.

2026-06-05 · 2 min

HOPSE: Codificador Posicional y Estructural de Alto Orden Escalable

Descubre HOPSE: codificador de alto orden que escala en aprendizaje topológico, superando a métodos tradicionales.

2026-06-05 · 2 min

HOPSE: Codificador de Posición y Estructura para Representaciones de Alto Orden

HOPSE ofrece codificación posicional y estructural escalable para aprendizaje topológico, superando a la propagación de mensajes en velocidad y precisión.

2026-06-05 · 2 min

Concept-SAE: Interfaz de Conceptos Controlable e Invertible

Descubre cómo Concept-SAE controla conceptos específicos en modelos de IA, mejorando interpretabilidad y detección adversarial.

2026-06-05 · 2 min

Hacia una prueba de independencia condicional escalable y válida con representaciones espectrales

Descubre cómo las representaciones espectrales mejoran la escalabilidad y validez en pruebas de independencia condicional. Un enfoque innovador con garantías teóricas.

2026-06-05 · 2 min

Aprendizaje por refuerzo profundo estable con representaciones gaussianas isotrópicas

Descubre cómo las representaciones gaussianas isotrópicas mejoran la estabilidad en aprendizaje por refuerzo profundo, reduciendo colapso de representación y neuronas inactivas.

2026-06-05 · 2 min

SOLARIS: Descarga especulativa de representaciones latentes para inferencia

Descubre cómo SOLARIS acelera la inferencia de modelos fundacionales con descarga especulativa, logrando un 0.67% de aumento en ingresos en Meta.

2026-06-05 · 2 min

Representation learning: la clave para escalar el RL multitarea

MR.Q demuestra que las representaciones predictivas escalan el RL multitarea sin planificación, superando a modelos del mundo.

2026-06-05 · 2 min

Descifrando dos relojes de entrenamiento en Grokking

Cómo el fenómeno Grokking separa el ajuste de datos de la simplificación de representaciones con dos relojes de entrenamiento. Teoría de redes lineales y ReLU.

2026-06-05 · 2 min

Teoría de alta dimensión del ajuste fino LoRA en atención

Teoría de alta dimensión para ajuste fino LoRA en atención. Descubre cómo el pre-entrenamiento afecta el error de prueba y la alineación. Ideal para optimizar modelos.

2026-06-05 · 2 min