Más allá del matching: Evaluación semántica de extracción de tablas PDF
Descubre cómo la evaluación semántica con LLM supera a TEDS y GriTS en precisión, con correlación humana de 0.93. Benchmark de 21 parsers PDF.
Descubre cómo la evaluación semántica con LLM supera a TEDS y GriTS en precisión, con correlación humana de 0.93. Benchmark de 21 parsers PDF.
Descubre Dr. DocBench, el benchmark que expone las limitaciones de los modelos actuales en el análisis de documentos expertos con 65k anotaciones en 52 dominios.
Descubre DraDDP, el primer dataset multimodal público para analizar discurso en diálogos multipartes. Basado en series de TV, impulsa la IA conversacional.