#qwen3

Investigación Profunda con DecomposeR: RL y Recompensa Estructural

DecomposeR optimiza la investigación profunda con RL centrado en planificador y recompensa estructural. Mejora hasta 8 puntos en benchmarks.

2026-06-03 · 2 min

Vectores funcionales multimodales para relaciones visuales

Descubre cómo los vectores de función multimodal permiten extraer y optimizar relaciones visuales en modelos de IA, mejorando el razonamiento sin necesidad de reentrenar.

2026-06-03 · 1 min

Agentes de Recompensa de Proceso para Guiar el Razonamiento Intensivo

Descubre cómo los PRA mejoran el razonamiento intensivo en conocimiento con recompensas paso a paso, logrando 81.9% en MedQA con Qwen3-4B.

2026-06-03 · 1 min

Qwen3.7-Plus de Alibaba: multimodal a bajo costo, pero propietario

Nuevo modelo multimodal de Alibaba, Qwen3.7-Plus, a bajo costo pero propietario. Analizamos su rendimiento, precios y licencia.

2026-06-03 · 3 min

R3-CoVR: marco zero-shot de razonamiento para videos compuestos

Descubre R3-CoVR, un marco zero-shot sin entrenamiento que alcanza 91.9% R@1 en recuperación de videos compuestos mediante razonamiento multimodal y reordenamiento.

2026-06-02 · 2 min

Ryze: Síntesis de datos enriquecida con evidencia de papers biomédicos

Descubre Ryze, un sistema que automatiza la creación de datasets enriquecidos con evidencia visual a partir de papers biomédicos, superando a GPT-5.

2026-06-02 · 2 min

Clasificación de documentos visuales con enfoques multimodales

Descubre cómo los modelos multimodales superan a los LLM en clasificación de documentos visuales. La información visual es clave. Resultados RVL-CDIP.

2026-06-02 · 2 min

ARCA: Asignación de Crédito Residual con Adaptadores en LLM

ARCA: método ligero de credit assignment para LLM con LoRA. Usa residuos de adaptadores, evita degeneración. Competitivo en MATH/Qwen3 sin reward model.

2026-06-02 · 2 min

Colaboración de modelos mejorada para detección de errores egocéntricos

Descubre cómo combinar modelos pequeños y grandes permite detectar errores raros y sutiles en videos de primera persona, equilibrando velocidad y precisión.

2026-06-02 · 2 min

Ajuste fino consciente del desbalance en Qwen3-8B para defensa psicológica

Descubre cómo logramos el 4° puesto en PsyDefDetect 2026 usando Qwen3-8B con ajuste fino consciente del desbalance, aumentando el F1 macro un 24.4% sobre la línea base.

2026-06-02 · 2 min

TRON: Entornos Verificables en Línea para Razonamiento Visual con RL

TRON genera instancias verificables bajo demanda para entrenar modelos de razonamiento visual con RL, mejorando benchmarks multimodales.

2026-06-02 · 1 min

Inferencia de bajo bit extremo en modelos de razonamiento: fallos y recuperación

Descubre cómo la inferencia 2-bit en modelos de razonamiento genera fallos como bucles y cómo la planificación y rescate recuperan precisión hasta 87%.

2026-06-02 · 2 min

PInVerify: benchmark offline para verificación activa de instancias

PInVerify es un nuevo benchmark offline que evalúa agentes encarnados en la verificación activa de objetos con atributos finos. Descubre cómo funciona y sus resultados con MLLMs.

2026-06-01 · 2 min