Espectro del discurso de odio: medición con IRT Rasch y deep learning explicable
Aprende a medir el discurso de odio en una escala continua usando teoría Rasch y deep learning explicable, ajustando por perspectiva de anotadores.
Aprende a medir el discurso de odio en una escala continua usando teoría Rasch y deep learning explicable, ajustando por perspectiva de anotadores.
Descubre cómo XCR-Bench evalúa la capacidad de los LLMs para razonar entre culturas, revelando sesgos ocultos en modelos avanzados.
Descubre ChemQuests, un dataset curado de 952 pares de preguntas y respuestas de química de ChemRxiv. Ideal para QA y fine-tuning de LLMs.
Genera datos de entrenamiento para correferencia multilingüe mediante traducción automática con consistencia cíclica.
IdiomX es un benchmark multilingüe con 190K ejemplos para evaluar comprensión, recuperación e interpretación de modismos en inglés, árabe y francés.
Typhoon propone un enmascaramiento basado en gradientes para modelos de lenguaje. ¿Supera al enmascaramiento aleatorio? Los resultados no muestran mejoras significativas.
Descubre MADPO, un método que utiliza un modelo de recompensa para ajustar dinámicamente el aprendizaje en la optimización de preferencias, superando las limitaciones de DPO.
Descubre cómo se documentan las anotaciones humanas en investigaciones de PLN entre 2018 y 2025, y qué aspectos clave suelen omitirse.
KliniskVestBERT: modelo BERT especializado en textos clínicos noruegos. Preentrenado con datos reales de hospitales, supera a modelos base en tareas de NLP clínico.
Descubre DraDDP, el primer dataset multimodal público para analizar discurso en diálogos multipartes. Basado en series de TV, impulsa la IA conversacional.