AlignAtt4LLM: Traducción simultánea con LLMs decoder-only
AlignAtt4LLM logra traducción simultánea inglés-alemán/italiano con baja latencia aplicando AlignAtt en LLMs solo decodificador. Resultados superiores.
AlignAtt4LLM logra traducción simultánea inglés-alemán/italiano con baja latencia aplicando AlignAtt en LLMs solo decodificador. Resultados superiores.
GC-MoE utiliza mezcla de expertos guiada por genómica para predecir expresión génica por célula desde histología, mejorando la precisión en transcripción espacial.
MOSS-Audio unifica voz, sonido y música con DeepStack y time markers. Descubre su arquitectura y rendimiento en ASR y razonamiento con audio.
Descubre ExtraBrain: alternativa responsable a Cluely para Mac. Copilot en vivo con transcripción local y contexto de pantalla.
El nuevo corpus BEA-Dialogue+ ofrece 200 horas de conversaciones naturales transcritas para ASR en húngaro. Con SOT se logran mejoras significativas en WER y CER. ¡Potencia tus sistemas de diálogo!
Descubre G-STAR, sistema E2E que integra seguimiento de oradores y transcripción LLM para reconocimiento atribuido preciso en reuniones multiparticipante.
Vakh en beta: lecciones y errores en conversión local de voz a texto. Descubre qué funcionó y qué no en esta experiencia de desarrollo.
Descubre el pipeline de IA que convierte notas de voz en artículos publicados. Optimiza tu contenido con inteligencia artificial.