Psi-Bench: Evaluación de la influencia persuasiva sensible a la personalidad
Nuevo benchmark Psi-Bench evalúa cómo los LLM persuaden según el perfil del usuario. La personalización mejora un 18% la efectividad.
Nuevo benchmark Psi-Bench evalúa cómo los LLM persuaden según el perfil del usuario. La personalización mejora un 18% la efectividad.
Descubre CA-BED: un marco que integra diseño bayesiano experimental con LLMs para elegir preguntas óptimas en diálogos. Mejora un 21.8% el éxito con solo 1.8 turnos extra.
Descubre cómo RefMem-Bench y REMIND evalúan y mejoran la memoria reflexiva en diálogos largos, superando la simple recuperación de hechos.
Descubre DraDDP, el primer dataset multimodal público para analizar discurso en diálogos multipartes. Basado en series de TV, impulsa la IA conversacional.
HypoAgent: marco agentic para generación interactiva de hipótesis abductivas en grafos de conocimiento. Logra similitud semántica estado del arte. ¡Descúbrelo!
CobSeg mejora la segmentación de temas en diálogos sin LLM. Reduce errores en benchmarks. Ideal para apps humano-IA.
El nuevo corpus BEA-Dialogue+ ofrece 200 horas de conversaciones naturales transcritas para ASR en húngaro. Con SOT se logran mejoras significativas en WER y CER. ¡Potencia tus sistemas de diálogo!
<meta name=description content=GrowLoop: evaluación autoevolutiva de conversaciones basada en humanos. Descubre cómo mejorar diálogos con retroalimentación inteligente y adaptativa.>
MGRetrieval: Recuperación Reflexiva con Memoria para Diálogos a Largo Plazo. Un sistema avanzado que mantiene coherencia en conversaciones extensas mediante recuperación inteligente.
Diálogos multiturno para optimizar la operación y mantenimiento industrial. Mejora la eficiencia, automatiza procesos y facilita la comunicación técnica.
Descubre cómo mitigar el cambio de distribución en diálogos multi-turno pasando del contexto estático al RL interactivo con un simulador alineado. Optimiza tus sistemas conversacionales.
Dataset de diálogos robot-paciente y médico-paciente para PLN hablado. Recurso único para investigar interacciones clínicas mediante procesamiento del lenguaje natural.