#qa · DeepCodeNews

LatentSkill: Habilidades latentes en pesos para agentes LLM

LatentSkill convierte habilidades textuales en adaptadores LoRA modulares, reduciendo tokens de prefijo hasta un 72% y mejorando rendimiento en agentes LLM. Descubre cómo.

2026-06-06 · 1 min

Mejora de extracción de respuestas en sistemas QA usando LLMs

Descubre cómo el fine-tuning de LLMs como Roberta-base mejora la extracción precisa de respuestas en sistemas QA. Resultados: ROUGE-L 86.84% y BERTScore 95.38%.

2026-06-06 · 2 min

Google DeepMind publica Gemma 4 QAT: Q4_0 y nuevo formato móvil reducen memoria

Descubre cómo los nuevos Gemma 4 QAT de Google DeepMind reducen la memoria hasta 1 GB en móviles sin perder calidad. Comparativa completa.

2026-06-06 · 3 min

Un marco de visión-lenguaje para razonamiento comparativo en radiología

MedReCo: un framework que permite a la IA razonar comparativamente entre imágenes radiológicas, mejorando diagnósticos y seguimientos. Resultados clínicos superiores.

2026-06-05 · 2 min

¿Necesitan los Transformers tres proyecciones? Estudio de QKV

Descubre cómo compartir proyecciones QKV en Transformers reduce el caché KV hasta 96.9% sin perder calidad, ideal para dispositivos edge.

2026-06-04 · 3 min

Modelo VLM consciente de creencias para razonamiento humano

Descubre cómo el modelo VLM consciente de creencias combina memoria y RL para un razonamiento similar al humano. Mejora en QA visual con HD-EPIC. ¡Lee más!

2026-06-04 · 2 min

Modelo VLM consciente de creencias para razonamiento humanoide

Descubre cómo un modelo VLM consciente de creencias integra memoria y aprendizaje por refuerzo para un razonamiento similar al humano, mejorando tareas de VQA.

2026-06-04 · 3 min

Redondeo Adaptativo que Preserva el Modelo

Descubre YAQA: algoritmo de redondeo adaptativo que reduce el error de cuantización un 30% frente a GPTQ. Cotas de error garantizadas sin coste de inferencia.

2026-06-04 · 1 min

Redondeo Adaptativo que Preserva el Modelo

Descubre YAQA, el algoritmo de redondeo adaptativo que reduce el error de cuantización un 30% sin sobrecarga. Preserva la distribución del modelo original.

2026-06-04 · 1 min

Estudio de la SI-SDR en separación de voz con referencias ruidosas

Analizamos el impacto de la relación señal-distorsión invariante a escala en la separación de voz con referencias ruidosas. Descubre cómo mejorar la calidad con NISQA.

2026-06-04 · 3 min

Estudio del SI-SDR en separación de voz con referencias ruidosas

Descubre cómo el ruido en las referencias afecta al SI-SDR en separación de voz y un método para mejorar la calidad del audio separado.

2026-06-04 · 2 min

R3G: Marco de Razonamiento-Recuperación-Reordenamiento para Respuestas Visuales

R3G: marco de razonamiento-recuperación-reordenamiento para VQA. Mejora la precisión al integrar un plan de razonamiento y recuperación de imágenes en dos etapas.

2026-06-04 · 2 min

Hyper-ICL: Destilación Hiperbólica para Aprendizaje Multimodal en Contexto

Descubre Hyper-ICL, un método ligero que elimina la necesidad de demostraciones en ICL multimodal, calibrando la atención con destilación hiperbólica para mejorar precisión y estabilidad.

2026-06-04 · 2 min

MorphoQuant: Cuantización Consciente de la Modalidad para LLMs Omni-Modales

Descubre MorphoQuant, un marco de cuantización que mantiene la precisión en modelos omni-modales con solo 4 bits, superando a modelos de 16 bits en ScienceQA.

2026-06-04 · 2 min

VISTA: Adaptación con visión y validación física de datos UMI para entrenamiento VLA

Descubre cómo VISTA combina visión y validación física para adaptar datos UMI y entrenar modelos VLA, mejorando el rendimiento en manipulación robótica real.

2026-06-04 · 1 min

Destilación de reglas ASP desde LLMs para VQA neurosimbolico

Aprende a destilar reglas de programación lógica desde LLMs para VQA interpretable, con solo pocos ejemplos. Alternativa eficiente al aprendizaje de reglas tradicional.

2026-06-03 · 1 min

TSQAgent: Calidad de Series Temporales con Razonamiento Agéntico

Descubre TSQAgent, un marco de agentes de IA que evalúa la calidad de series temporales mediante razonamiento y herramientas analíticas. Mejora la selección de datos y el rendimiento.

2026-06-03 · 2 min

Optimización de Políticas Guiada por Física con Autodestilación

Descubre PGPO, un nuevo método de optimización guiado por la física que estabiliza el post-entrenamiento de LLMs, mejorando hasta 4.5 puntos en Science-QA.

2026-06-03 · 2 min

Sondas Lineales Detectan el Formato de la Tarea, No el Razonamiento

¿Las sondas lineales detectan razonamiento o formato? Un estudio revela que la precisión en LLMs se explica por confusores de formato, no por modos de razonamie

2026-06-03 · 2 min

Investigación Profunda con DecomposeR: RL y Recompensa Estructural

DecomposeR optimiza la investigación profunda con RL centrado en planificador y recompensa estructural. Mejora hasta 8 puntos en benchmarks.

2026-06-03 · 2 min