LoopMoE: Unificando Iteración y Mezcla de Expertos en Lenguaje
Descubre cómo LoopMoE integra computación iterativa con Mezcla de Expertos para superar a modelos tradicionales en benchmarks de lenguaje. ¡Mejora de rendimiento a escalas de 3B y 9B!
Descubre cómo LoopMoE integra computación iterativa con Mezcla de Expertos para superar a modelos tradicionales en benchmarks de lenguaje. ¡Mejora de rendimiento a escalas de 3B y 9B!
Descubre DeliChess, un dataset innovador de diálogos grupales para resolver puzzles de ajedrez. Mejora la precisión mediante deliberación colaborativa.
Descubre cómo mejoramos los Oráculos de Activación: reducimos alucinaciones y vaguedad. Presentamos AObrench, el primer conjunto de evaluación completo.
Descubre TypewriterLM, un modelo de lenguaje de 7.24B parámetros entrenado con textos anteriores a 1913. Supera desafíos de calidad y fuga temporal.
Descubre EuroBERT, la nueva familia de codificadores multilingües. Supera a alternativas en recuperación, clasificación y más. Soporta 8,192 tokens.
Descubre cómo el clustering de verbos basado en un léxico sintáctico mejora el análisis sintáctico del francés en parsers probabilísticos.
Las redes profundas aprenden a analizar lenguajes libres de contexto usando solo estadísticas locales. Un estudio revela cómo emergen representaciones jerárquicas.
Descubre cómo se documentan las anotaciones humanas en investigaciones de PLN entre 2018 y 2025, y qué aspectos clave suelen omitirse.
Descubre cómo un mapa jerárquico semántico-geométrico permite navegar en 3D con instrucciones de lenguaje, superando métodos supervisados.
Optimiza el escalado de modelos dispersos con datos limitados. Descubre leyes de escalado, saturación retardada y compensaciones clave.
Descubre cómo los modelos de lenguaje grandes representan diferentes idiomas desde un punto de vista estructural y qué diferencias clave existen entre lenguas de bajos y altos recursos.
Descubre DraDDP, el primer dataset multimodal público para analizar discurso en diálogos multipartes. Basado en series de TV, impulsa la IA conversacional.
FiVeD: verificación de grano fino para mejorar la extracción de tripletes de sentimiento. Aumenta F1 hasta 3.53. Ideal para sistemas de opinión.
Descubre cómo generar datos de entrenamiento multi-salto a escala usando restricciones de grafos, mejorando el razonamiento compuesto en LLMs. Resultados: Token F1 del 38.58% en contratos legales.