Modelos Autorregresivos Lineales de Dos Capas Estiman Estados Latentes
Descubre cómo los modelos autorregresivos de dos capas estiman estados latentes imitando el filtrado de Kalman. Con resultados teóricos.
Descubre cómo los modelos autorregresivos de dos capas estiman estados latentes imitando el filtrado de Kalman. Con resultados teóricos.
Descubre AfriSUD, la primera colección de treebanks sintácticos para 9 lenguas africanas. Evalúa modelos NLP y descubre la brecha sintáctica.
Descubre el MPC agentivo que integra LLMs para adaptar el control semántico en vehículos autónomos, respondiendo a normas sociales y preferencias del usuario.
Localización de circuitos de anclaje en modelos de lenguaje. Un estudio de Qwen y Llama revela cómo las señales de sesgo se transmiten internamente.
OCOO-T: modelo de célula virtual minimalista que predice respuestas transcripcionales a perturbaciones con alta precisión y escalabilidad.
TimeROME-DLM permite editar conocimiento en modelos de difusión enmascarados sin reentrenar. Rápido, sin VRAM extra, escala a 400 hechos. ¡Conócelo!
UOJ-Bench evalúa LLMs en programación competitiva: generación, hacking y reparación. En una prueba, fallan en detectar >50% errores; con escalado superan >90%.
Aislamiento modal en razonamiento intercalado reduce coherencia. MoTiF supervisa transiciones con refuerzo paso a paso para mejorar precisión en tareas.
GRASP combina visión-lenguaje y planificación neuro-simbólica para agarre robótico con lenguaje natural. 73.3% de éxito sin entrenamiento. ¡Descúbrelo!
Descubre por qué el orden no implica control en sistemas complejos: evidencia experimental en IA, biología y modelos de lenguaje que redefine la alineación.
Descubre cómo proteger tus modelos de difusión de imágenes con una nueva técnica de fingerprinting robusta contra ataques de colusión. Precisión superior al 99.5% y alta fidelidad.
Un modelo Diffusion Transformer predice escenas de conducción con 4.8x mejor KID que la regresión, permitiendo simulaciones realistas y control de acciones.
scLLM-DSC: un novedoso marco de clustering multimodal que aprovecha grandes modelos de lenguaje para mejorar la precisión en el análisis de células individuales.
CausalMoE, un modelo multimodal, revoluciona la detección causal de Granger usando expertos heterogéneos y patrones temporales, integrando LLMs y VLMs.
TetherCache: estabiliza la generación de video largo autorregresivo sin entrenamiento, reduciendo deriva temporal y artefactos.
Descubre CausalMoE, el primer modelo fundacional multimodal que integra LLMs y VLMs para descubrimiento causal Granger preciso en series temporales complejas.
Descubre cómo TetherCache estabiliza la generación de video largo con un sistema de caché inteligente, reduciendo deriva y mejorando la calidad hasta 240 segundos.
Descubre cómo EA-WM integra verificación de eventos en modelos del mundo para una manipulación robótica más precisa y segura en tareas de largo horizonte.
EA-WM verifica eventos en modelos de mundo para manipulación robótica a largo plazo. Mejora planificación y control con predicciones interpretables.
Descubre cómo TWLA, mediante cuantización post-entrenamiento, reduce el tamaño y acelera la inferencia de LLMs usando pesos ternarios y activaciones de 4 bits.