Traduciendo lo intraducible: Ontología operacionalizable
Descubre una ontología para la intraducibilidad en NLP y estrategias de compensación que mejoran la traducción automática. Preferencias humanas.
Descubre una ontología para la intraducibilidad en NLP y estrategias de compensación que mejoran la traducción automática. Preferencias humanas.
Descubre cómo estructurar argumentos legales en sentencias judiciales chinas con un marco de anotación sistemático, ideal para IA y análisis legal.
Un estudio compara la visualización 2D interactiva con métodos aleatorios y FAFT para anotar series temporales biomédicas. Expertos y no expertos evalúan su
El enrutamiento de agentes empresariales se degrada al escalar. Diagnóstico y recuperación con selección basada en embeddings. Estudio con 1.435 ejemplos.
Descubre cómo la propagación de etiquetas de cajas delimitadoras permite re-anotar datasets con solo 10% de datos etiquetados, logrando un 81.6% del
Metric Match reduce un 32% las anotaciones humanas para evaluar fiabilidad de jueces LLM, mejorando precisión y ahorrando costos.
Descubre YTClickbait21K: un dataset multimodal con 21K videos anotados por humanos para detectar clickbait en YouTube. Ideal para modelos de IA y moderación.
Descubre cómo la supervisión humana y G2P afecta la transcripción fonética: un umbral de 20-30 horas y el preentrenamiento ASR logran una reducción de error de
Descubre cómo el MergeSort guiado por sorpresa reduce costos de ranking al delegar comparaciones fáciles a la IA. ¡Mejora la eficiencia!
Descubre cómo FluidTest detecta amenazas adicionales en trayectorias de vehículos autónomos, revelando fallos de seguridad que las métricas tradicionales pasan
EDEN: 4 millones de notas clínicas anonimizadas de urgencias italianas. Un dataset único para entrenar modelos de lenguaje en diagnóstico de disnea y pérdida de conciencia.
Descubre por qué los laboratorios de IA priorizan la fiabilidad y consistencia de los datos sobre el volumen. Claves para ser un socio de datos exitoso.
Descubre FADA: un modelo unificado de visión-lenguaje que interpreta y anota ecografías fetales sin nube, funciona en smartphones y democratiza el diagnóstico prenatal.
Descubre cómo la resolución de índices espaciales mejora el reconocimiento de lenguaje de señas, capturando gestos deícticos que los modelos tradicionales ignoran.
Descubre RiskNet: el mayor dataset de incidentes de riesgo de IA. Analiza y clasifica riesgos reales para mejorar gobernanza.
Descubre cómo el reetiquetado activo reduce el ruido en anotaciones humanas, mejorando la eficiencia del aprendizaje activo. ¡Optimiza tus modelos!
El clonado conductual optimiza la anotación de datos, reduce errores y acelera procesos. Estudio revela habilidades emergentes y representaciones internas.
Descubre BRAINCELL-AID, un sistema de IA agéntica que revoluciona la anotación de tipos celulares cerebrales. Mejora la precisión con RAG y análisis de RNA-seq.
Descubre cómo BRAINCELL-AID usa IA multiagente y RAG para anotar tipos de células cerebrales con alta precisión, facilitando la investigación en neurociencia.
Annot-Mix mejora el entrenamiento con etiquetas ruidosas de múltiples anotadores vía Mixup. Superior a 11 enfoques en 11 datasets.