Destilación de reglas ASP desde LLMs para VQA neurosimbolico
Aprende a destilar reglas de programación lógica desde LLMs para VQA interpretable, con solo pocos ejemplos. Alternativa eficiente al aprendizaje de reglas tradicional.
Aprende a destilar reglas de programación lógica desde LLMs para VQA interpretable, con solo pocos ejemplos. Alternativa eficiente al aprendizaje de reglas tradicional.
Aprende cómo la autoevaluación por clusters permite a los LLMs medir su incertidumbre con solo dos muestras, mejorando la confiabilidad de sus respuestas.
Descubre DTKG, un marco que combina verificación de hechos y cadenas en grafos de conocimiento para responder preguntas multi-salto con alta precisión.
Descubre cómo un enfoque adaptativo con LLM y redes neuronales predice opiniones grupales con solo el 10% de encuestados.
Descubre BYORn, método que protege modelos visión-lenguaje durante fine-tuning contra ataques backdoor, mejorando robustez.
Descubre cómo KeyVT optimiza la selección de vistas y tokens para responder preguntas sobre escenas 3D sin entrenamiento, superando a métodos existentes.
Descubre un marco ligero de LLM con destilación y agregación logra un 98.25% de precisión en auditoría de contratos inteligentes, superando modelos grandes.
InFerActive: árbol interactivo para evaluar seguridad de LLMs. Reduce hasta 5x las muestras necesarias y mejora la cobertura de respuestas dañinas.
Los agentes de IA fallan con respuestas seguras pero incorrectas. La capa de contexto de Snowflake (Horizon y Cortex Sense) es la clave para la precisión empresarial.
Descubre cómo la parada bayesiana óptima permite obtener respuestas consistentes de LLM usando menos muestras, ahorrando hasta un 50% en costos de inferencia.
SafeMoE aprovecha conocimiento inseguro para respuestas seguras e informativas, superando en un 20% la tasa de seguridad. Un nuevo paradigma en alineamiento.
Descubre REST-ASMR, un dataset multimodal que combina fotopletismografía y anotaciones subjetivas para predecir estados ASMR con alta precisión. Ideal para IA afectiva.
Estudio evalúa la fiabilidad de motores de búsqueda y asistentes IA al responder preguntas factuales en chino, revelando diferencias clave.
Los modelos de recompensa en IA tienen sesgos. La recompensa mecánica los mitiga con pocos datos. Optimiza la alineación de modelos de lenguaje.
Descubre cómo el entrenamiento con múltiples respuestas mejora la generalización de modelos de lenguaje, evitando la lotería de modos. Guía práctica.
Descubre ODTQA-FoRe, el primer dataset para preguntas tabulares con predicción futura. TimeFore combina LLM y modelos de series temporales para pronósticos precisos en datos inmobiliarios.
Descubre cómo el marco ECP combina LLMs y Lean para resolver problemas de construcción de respuestas con pruebas formales verificadas.
Descubre los límites de los grandes modelos de lenguaje al interpretar el significado pragmático de respuestas no verbales. Un estudio revela caídas de precisión de hasta el 60%.
SPADER utiliza aprendizaje por refuerzo con recompensas de exploración diversa para mejorar el recuerdo y F1 en QA multi-respuesta.
Evaluamos cómo los LLMs fallan al responder consultas sobre trastornos alimentarios, generando falsa seguridad. Un estudio con expertos clínicos revela los riesgos.