#procesamiento del lenguaje natural

LoopMoE: Unificando Iteración y Mezcla de Expertos en Lenguaje

Descubre cómo LoopMoE integra computación iterativa con Mezcla de Expertos para superar a modelos tradicionales en benchmarks de lenguaje. ¡Mejora de rendimiento a escalas de 3B y 9B!

2026-06-04 · 3 min

DeliChess: dataset de diálogo multiagente para deliberación en ajedrez

Descubre DeliChess, un dataset innovador de diálogos grupales para resolver puzzles de ajedrez. Mejora la precisión mediante deliberación colaborativa.

2026-06-04 · 2 min

Construyendo Mejores Oráculos de Activación

Descubre cómo mejoramos los Oráculos de Activación: reducimos alucinaciones y vaguedad. Presentamos AObrench, el primer conjunto de evaluación completo.

2026-06-03 · 2 min

Preentrenamiento de modelos de lenguaje en textos históricos

Descubre TypewriterLM, un modelo de lenguaje de 7.24B parámetros entrenado con textos anteriores a 1913. Supera desafíos de calidad y fuga temporal.

2026-06-03 · 2 min

EuroBERT: Escalando Codificadores Multilingües para Lenguas Europeas

Descubre EuroBERT, la nueva familia de codificadores multilingües. Supera a alternativas en recuperación, clasificación y más. Soporta 8,192 tokens.

2026-06-03 · 2 min

Análisis sintáctico francés mejorado con clustering de palabras basado en léxico

Descubre cómo el clustering de verbos basado en un léxico sintáctico mejora el análisis sintáctico del francés en parsers probabilísticos.

2026-06-02 · 2 min

Redes profundas analizan lenguajes libres de contexto con estadísticas locales

Las redes profundas aprenden a analizar lenguajes libres de contexto usando solo estadísticas locales. Un estudio revela cómo emergen representaciones jerárquicas.

2026-06-02 · 1 min

¿Quién anota en PLN? Evaluación masiva de informes de anotación humana (2018-2025)

Descubre cómo se documentan las anotaciones humanas en investigaciones de PLN entre 2018 y 2025, y qué aspectos clave suelen omitirse.

2026-06-02 · 2 min

Mapa jerárquico semántico-geométrico para navegación visual-lingüística

Descubre cómo un mapa jerárquico semántico-geométrico permite navegar en 3D con instrucciones de lenguaje, superando métodos supervisados.

2026-06-02 · 3 min

Cuando datos escasean: escalando modelos dispersos con entrenamiento repetido

Optimiza el escalado de modelos dispersos con datos limitados. Descubre leyes de escalado, saturación retardada y compensaciones clave.

2026-06-02 · 1 min

Multilingüismo de los modelos de lenguaje grandes desde una perspectiva estructural

Descubre cómo los modelos de lenguaje grandes representan diferentes idiomas desde un punto de vista estructural y qué diferencias clave existen entre lenguas de bajos y altos recursos.

2026-06-02 · 1 min

DraDDP: Dataset multimodal para análisis de discurso en diálogos multipartes

Descubre DraDDP, el primer dataset multimodal público para analizar discurso en diálogos multipartes. Basado en series de TV, impulsa la IA conversacional.

2026-06-02 · 2 min

Verificación detallada con razonamiento diagnóstico para extracción de tripletes de sentimiento

FiVeD: verificación de grano fino para mejorar la extracción de tripletes de sentimiento. Aumenta F1 hasta 3.53. Ideal para sistemas de opinión.

2026-06-01 · 3 min

Escalado de datos multi-salto con selección de rutas restringida por grafos

Descubre cómo generar datos de entrenamiento multi-salto a escala usando restricciones de grafos, mejorando el razonamiento compuesto en LLMs. Resultados: Token F1 del 38.58% en contratos legales.

2026-06-01 · 1 min