Construir en público: Semana 6. Intentando agregar más plataformas sociales
Construir en público: Semana 6. Intentando agregar más plataformas sociales
La semana pasada nos centramos en observabilidad: métricas y dashboards para ver qué hace realmente el sistema en lugar de confiar en la intuición. Esta semana no trató de inventar algo nuevo desde cero sino de responder una pregunta práctica: se puede extender la misma idea a otras plataformas sociales sin que todo el sistema se rompa Por respuesta corta: parcialmente
Resumen del flujo general usado en Wykra El sistema responde a una petición en texto libre con un id de tarea mientras el trabajo real ocurre en segundo plano Un worker toma la tarea, convierte la frase en parámetros de búsqueda estructurados, dispara un dataset de Bright Data, puntúa los perfiles con un LLM filtra los irrelevantes y almacena los resultados para que puedan recuperarse desde tasks id
TikTok: problema similar, forma distinta TikTok siguió la misma narrativa básica que Instagram pero con una diferencia clave TikTok ofrece búsqueda por palabras clave dentro del dataset lo que nos permitió saltarnos un paso de descubrimiento previo Para cada término generamos una URL de búsqueda en TikTok activamos el dataset de Bright Data esperamos el snapshot descargamos el JSON y luego fusionamos y deduplicamos perfiles por su URL
El LLM vuelve a entrar para extraer lo básico de cada perfil handle URL seguidores privacidad bio y generar un breve resumen una puntuación de calidad del 1 al 5 y un porcentaje de relevancia Cualquier perfil con menos de 70% de relevancia se descarta Todo lo demás se guarda y se asocia a la tarea El patrón se mantiene contexto estructurado al frente Bright Data en el medio y LLM para puntuar a la salida
Tareas métricas y disciplina Todo corre como jobs de larga duración ligados a un id de tarea El ciclo de vida es simple pending running completed o failed Guardamos el registro de tarea y los perfiles analizados Cuando pides tasks id ves tanto el estado crudo de la tarea como la lista de perfiles analizados Esto ayuda a depurar porque si TikTok está vacío pero la tarea está completada el problema suele estar en el crawling o en el análisis y no en la cola Además casi cada paso está envuelto en métricas cuántas tareas de TikTok se crean completan o fallan cuánto tiempo están en cola tiempo de llamadas a Bright Data errores llamadas a LLM y coste
YouTube el spinner de media hora YouTube nos recordó que no todo está listo para enchufarse a Wykra aunque la arquitectura parezca limpia En un test ligero lanzamos una URL de búsqueda de YouTube y tras unos 30 minutos de espera lo único que devolvió fue un error de parsing JSON proveniente del crawler Así que por ahora YouTube no está integrado: el dataset gira, devuelve error de crawler y no hay datos útiles Hemos abierto ticket con Bright Data y posponemos YouTube hasta que lo solucionen
Threads parámetro presente lógica ausente En Threads la llamada básica por palabra clave existe pero la capa que la conecta con el dataset falló en parsing El parámetro keyword está pero la pieza intermedia no funciona Por ahora lo tratamos igual que YouTube: registrado y movido a la lista de tareas pendientes
LinkedIn: el mismo viejo problema LinkedIn comparte la limitación de Instagram no tiene una búsqueda por palabra clave tan directa que permita encontrar personas que hablen de X desde Y Sin una capa de descubrimiento tipo Perplexity o LLM encima del dataset no conseguimos el comportamiento que Wykra necesita Es un problema definido para otra semana pero al menos ya sabemos qué falta
Conclusión de la semana 6 Probamos hasta dónde llega el patrón existente y dónde se rompe TikTok se comportó bien YouTube y Threads no funcionaron y LinkedIn exige una capa de búsqueda adicional Mejor tener un par de flujos que funcionen bien que cinco semirotos
Sobre Q2BSTUDIO En Q2BSTUDIO somos una empresa de desarrollo de software y aplicaciones a medida especializada en soluciones a medida para empresas Ofrecemos software a medida y aplicaciones a medida junto con servicios de inteligencia artificial ciberseguridad y servicios cloud aws y azure También brindamos servicios inteligencia de negocio y power bi para convertir datos en decisiones y desarrollamos agentes IA y soluciones de ia para empresas que amplifican productividad y automatización
Si tu empresa necesita una plataforma personalizada o desarrollar una integración con APIs y datasets podemos ayudar Revisa nuestras opciones para desarrollo de aplicaciones y software a medida en servicios de desarrollo de aplicaciones multiplataforma y conoce nuestras soluciones de inteligencia artificial y agentes IA en servicios de inteligencia artificial para empresas
Semana 6 fue aprendizaje y priorización Aprendimos qué partes del patrón son portables y cuáles requieren capas específicas de integración Si quieres seguir el proyecto o colaborar apoyar el repo y dar feedback en redes ayuda mucho
Comentarios