#pln · DeepCodeNews

Espectro del discurso de odio: medición con IRT Rasch y deep learning explicable

Aprende a medir el discurso de odio en una escala continua usando teoría Rasch y deep learning explicable, ajustando por perspectiva de anotadores.

2026-06-09 · 2 min

XCR-Bench: Benchmark de razonamiento transcultural en LLMs

Descubre cómo XCR-Bench evalúa la capacidad de los LLMs para razonar entre culturas, revelando sesgos ocultos en modelos avanzados.

2026-06-09 · 1 min

ChemQuests: Base de datos curada de preguntas y respuestas de química

Descubre ChemQuests, un dataset curado de 952 pares de preguntas y respuestas de química de ChemRxiv. Ideal para QA y fine-tuning de LLMs.

2026-06-08 · 1 min

Resolución de correferencia multilingüe con traducción cíclica consistente

Genera datos de entrenamiento para correferencia multilingüe mediante traducción automática con consistencia cíclica.

2026-06-05 · 2 min

IdiomX: Benchmark multilingüe para comprensión y recuperación de modismos

IdiomX es un benchmark multilingüe con 190K ejemplos para evaluar comprensión, recuperación e interpretación de modismos en inglés, árabe y francés.

2026-06-03 · 3 min

Typhoon: Estrategia de enmascaramiento adaptativo para modelos de lenguaje

Typhoon propone un enmascaramiento basado en gradientes para modelos de lenguaje. ¿Supera al enmascaramiento aleatorio? Los resultados no muestran mejoras significativas.

2026-06-03 · 2 min

MADPO: Optimización Adaptativa de Preferencias por Márgenes

Descubre MADPO, un método que utiliza un modelo de recompensa para ajustar dinámicamente el aprendizaje en la optimización de preferencias, superando las limitaciones de DPO.

2026-06-02 · 1 min

¿Quién anota en PLN? Evaluación masiva de informes de anotación humana (2018-2025)

Descubre cómo se documentan las anotaciones humanas en investigaciones de PLN entre 2018 y 2025, y qué aspectos clave suelen omitirse.

2026-06-02 · 2 min

KliniskVestBERT: Modelo BERT especializado en textos clínicos noruegos

KliniskVestBERT: modelo BERT especializado en textos clínicos noruegos. Preentrenado con datos reales de hospitales, supera a modelos base en tareas de NLP clínico.

2026-06-02 · 3 min

DraDDP: Dataset multimodal para análisis de discurso en diálogos multipartes

Descubre DraDDP, el primer dataset multimodal público para analizar discurso en diálogos multipartes. Basado en series de TV, impulsa la IA conversacional.

2026-06-02 · 2 min