#mode

Modelos Autorregresivos Lineales de Dos Capas Estiman Estados Latentes

Descubre cómo los modelos autorregresivos de dos capas estiman estados latentes imitando el filtrado de Kalman. Con resultados teóricos.

2026-06-12 · 2 min

AfriSUD: Treebanks para evaluar modelos en lenguas africanas

Descubre AfriSUD, la primera colección de treebanks sintácticos para 9 lenguas africanas. Evalúa modelos NLP y descubre la brecha sintáctica.

2026-06-12 · 1 min

MPC Agentivo para la Resíntesis Semántica de Control

Descubre el MPC agentivo que integra LLMs para adaptar el control semántico en vehículos autónomos, respondiendo a normas sociales y preferencias del usuario.

2026-06-12 · 2 min

Localizando vías de anclaje en modelos de lenguaje

Localización de circuitos de anclaje en modelos de lenguaje. Un estudio de Qwen y Llama revela cómo las señales de sesgo se transmiten internamente.

2026-06-12 · 1 min

OCOO-T: Modelo Celular Virtual para Predicción de Respuestas Transcripcionales

OCOO-T: modelo de célula virtual minimalista que predice respuestas transcripcionales a perturbaciones con alta precisión y escalabilidad.

2026-06-12 · 1 min

TimeROME-DLM: Edición de conocimiento en inferencia sin entrenamiento

TimeROME-DLM permite editar conocimiento en modelos de difusión enmascarados sin reentrenar. Rápido, sin VRAM extra, escala a 400 hechos. ¡Conócelo!

2026-06-12 · 1 min

Más allá de resolver: UOJ-Bench para evaluar generación, hacking y reparación

UOJ-Bench evalúa LLMs en programación competitiva: generación, hacking y reparación. En una prueba, fallan en detectar >50% errores; con escalado superan >90%.

2026-06-12 · 2 min

Superando el aislamiento modal en el pensamiento intercalado

Aislamiento modal en razonamiento intercalado reduce coherencia. MoTiF supervisa transiciones con refuerzo paso a paso para mejorar precisión en tareas.

2026-06-12 · 3 min

GRASP: agarre robótico con lenguaje natural y planificación neuro-simbólica

GRASP combina visión-lenguaje y planificación neuro-simbólica para agarre robótico con lenguaje natural. 73.3% de éxito sin entrenamiento. ¡Descúbrelo!

2026-06-12 · 2 min

El orden no es control

Descubre por qué el orden no implica control en sistemas complejos: evidencia experimental en IA, biología y modelos de lenguaje que redefine la alineación.

2026-06-12 · 2 min

Fingerprinting eficiente, robusto y anticolusión en modelos de difusión de imágenes

Descubre cómo proteger tus modelos de difusión de imágenes con una nueva técnica de fingerprinting robusta contra ataques de colusión. Precisión superior al 99.5% y alta fidelidad.

2026-06-12 · 3 min

Modelo de Acción-Mundo con Diffusion Transformer para Predicción AV

Un modelo Diffusion Transformer predice escenas de conducción con 4.8x mejor KID que la regresión, permitiendo simulaciones realistas y control de acciones.

2026-06-12 · 2 min

scLLM-DSC: Clustering multimodal con LLM para ARN-seq unicelular

scLLM-DSC: un novedoso marco de clustering multimodal que aprovecha grandes modelos de lenguaje para mejorar la precisión en el análisis de células individuales.

2026-06-12 · 2 min

CausalMoE: modelo fundacional multimodal para causalidad de Granger

CausalMoE, un modelo multimodal, revoluciona la detección causal de Granger usando expertos heterogéneos y patrones temporales, integrando LLMs y VLMs.

2026-06-12 · 2 min

TetherCache: estabiliza video largo autorregresivo

TetherCache: estabiliza la generación de video largo autorregresivo sin entrenamiento, reduciendo deriva temporal y artefactos.

2026-06-12 · 2 min

CausalMoE: Modelo fundacional multimodal para causalidad Granger

Descubre CausalMoE, el primer modelo fundacional multimodal que integra LLMs y VLMs para descubrimiento causal Granger preciso en series temporales complejas.

2026-06-12 · 2 min

TetherCache: Estabilizando la generación de video largo con memoria y alineación

Descubre cómo TetherCache estabiliza la generación de video largo con un sistema de caché inteligente, reduciendo deriva y mejorando la calidad hasta 240 segundos.

2026-06-12 · 2 min

EA-WM: Modelos Mundiales Conscientes de Eventos para Largo Plazo

Descubre cómo EA-WM integra verificación de eventos en modelos del mundo para una manipulación robótica más precisa y segura en tareas de largo horizonte.

2026-06-12 · 2 min

EA-WM: Modelos del mundo conscientes de eventos para manipulación a largo plazo

EA-WM verifica eventos en modelos de mundo para manipulación robótica a largo plazo. Mejora planificación y control con predicciones interpretables.

2026-06-12 · 3 min

TWLA: Cuantización post-entrenamiento pesos ternarios y activaciones de bajo bit

Descubre cómo TWLA, mediante cuantización post-entrenamiento, reduce el tamaño y acelera la inferencia de LLMs usando pesos ternarios y activaciones de 4 bits.

2026-06-12 · 2 min