#respuestas

Destilación de reglas ASP desde LLMs para VQA neurosimbolico

Aprende a destilar reglas de programación lógica desde LLMs para VQA interpretable, con solo pocos ejemplos. Alternativa eficiente al aprendizaje de reglas tradicional.

2026-06-03 · 1 min

Autoevaluación Agrupada: Método Simple para Incertidumbre en LLMs

Aprende cómo la autoevaluación por clusters permite a los LLMs medir su incertidumbre con solo dos muestras, mejorando la confiabilidad de sus respuestas.

2026-06-03 · 3 min

DTKG: Razonamiento dual con grafos de conocimiento para QA multi-salto

Descubre DTKG, un marco que combina verificación de hechos y cadenas en grafos de conocimiento para responder preguntas multi-salto con alta precisión.

2026-06-03 · 3 min

A quién y qué preguntar: elicitación grupal adaptativa con LLM

Descubre cómo un enfoque adaptativo con LLM y redes neuronales predice opiniones grupales con solo el 10% de encuestados.

2026-06-03 · 2 min

BYORn: Genera tus propias respuestas para defender modelos de visión-lenguaje

Descubre BYORn, método que protege modelos visión-lenguaje durante fine-tuning contra ataques backdoor, mejorando robustez.

2026-06-03 · 2 min

Respuesta a preguntas 3D Zero-Shot mediante transporte jerárquico de vista a token

Descubre cómo KeyVT optimiza la selección de vistas y tokens para responder preguntas sobre escenas 3D sin entrenamiento, superando a métodos existentes.

2026-06-03 · 3 min

Auditoría de Contratos Inteligentes con LLM Ligero vía Destilación y Agregación

Descubre un marco ligero de LLM con destilación y agregación logra un 98.25% de precisión en auditoría de contratos inteligentes, superando modelos grandes.

2026-06-03 · 3 min

InFerActive: Exploración interactiva en árbol para seguridad de LLM

InFerActive: árbol interactivo para evaluar seguridad de LLMs. Reduce hasta 5x las muestras necesarias y mejora la cobertura de respuestas dañinas.

2026-06-02 · 3 min

Agentes IA: respuestas confiadas pero incorrectas, el rol de la capa de contexto

Los agentes de IA fallan con respuestas seguras pero incorrectas. La capa de contexto de Snowflake (Horizon y Cortex Sense) es la clave para la precisión empresarial.

2026-06-02 · 2 min

Parada Bayesiana Óptima para Respuestas Consistentes de LLMs

Descubre cómo la parada bayesiana óptima permite obtener respuestas consistentes de LLM usando menos muestras, ahorrando hasta un 50% en costos de inferencia.

2026-06-02 · 4 min

Dialéctica del alineamiento: conocimiento inseguro para enrutamiento dinámico

SafeMoE aprovecha conocimiento inseguro para respuestas seguras e informativas, superando en un 20% la tasa de seguridad. Un nuevo paradigma en alineamiento.

2026-06-02 · 2 min

Dataset REST-ASMR: fotopletismografía y respuestas conductuales

Descubre REST-ASMR, un dataset multimodal que combina fotopletismografía y anotaciones subjetivas para predecir estados ASMR con alta precisión. Ideal para IA afectiva.

2026-06-02 · 2 min

Asimetrías de fiabilidad en búsquedas factuales chinas y respuestas IA

Estudio evalúa la fiabilidad de motores de búsqueda y asistentes IA al responder preguntas factuales en chino, revelando diferencias clave.

2026-06-02 · 1 min

Sesgo tras sesgo: recompensa mecánica en modelos de lenguaje

Los modelos de recompensa en IA tienen sesgos. La recompensa mecánica los mitiga con pocos datos. Optimiza la alineación de modelos de lenguaje.

2026-06-02 · 2 min

Multi-respuesta: clave para generalización en modelos de lenguaje

Descubre cómo el entrenamiento con múltiples respuestas mejora la generalización de modelos de lenguaje, evitando la lotería de modos. Guía práctica.

2026-06-02 · 3 min

ODTQA-FoRe: dataset para preguntas tabulares y pronóstico

Descubre ODTQA-FoRe, el primer dataset para preguntas tabulares con predicción futura. TimeFore combina LLM y modelos de series temporales para pronósticos precisos en datos inmobiliarios.

2026-06-02 · 2 min

Resolviendo problemas de construcción de respuestas con Lean formalmente

Descubre cómo el marco ECP combina LLMs y Lean para resolver problemas de construcción de respuestas con pruebas formales verificadas.

2026-06-02 · 2 min

Límites de los LLM al inferir significado pragmático de respuestas no verbales

Descubre los límites de los grandes modelos de lenguaje al interpretar el significado pragmático de respuestas no verbales. Un estudio revela caídas de precisión de hasta el 60%.

2026-06-02 · 1 min

SPADER: Recompensas de Exploración con Diversidad para QA Multi-Respuesta

SPADER utiliza aprendizaje por refuerzo con recompensas de exploración diversa para mejorar el recuerdo y F1 en QA multi-respuesta.

2026-06-02 · 2 min

LLMs y trastornos alimentarios: fallos en adaptación a consultas

Evaluamos cómo los LLMs fallan al responder consultas sobre trastornos alimentarios, generando falsa seguridad. Un estudio con expertos clínicos revela los riesgos.

2026-06-02 · 2 min