Introducción: hubo un tiempo en que términos como inteligencia artificial e visión por computadora parecían una bestia de siete cabezas; para mí lo fueron hasta que decidí explorar y entender qué ocurre detrás del telón. En ese proceso descubrí Teachable Machine de Google, una herramienta visual que permite entrenar modelos de reconocimiento de imágenes de forma sencilla y sin escribir código, y mi primer experimento fue construir un reconocedor de letras de Libras

Motivación: la accesibilidad siempre ha sido un punto clave. Libras es la lengua de la comunidad sorda en Brasil, una lengua completa y rica que permite comunicar ideas complejas. Imaginé poder usar la cámara de un teléfono para traducir Libras en tiempo real y así cerrar brechas de comunicación. Con esa idea en mente trabajé un prototipo y confirmé que hoy la tecnología permite construir soluciones inclusivas con rapidez

Sobre Q2BSTUDIO: en Q2BSTUDIO somos una empresa de desarrollo de software y aplicaciones a medida especializada en inteligencia artificial, ciberseguridad y servicios cloud. Ofrecemos soluciones que van desde aplicaciones a medida hasta proyectos de agentes IA y consultoría en servicios inteligencia de negocio. Si buscas potenciar un proyecto con software a medida puedes conocer nuestros servicios de desarrollo de aplicaciones y software a medida y si necesitas avanzar en capacidades de inteligencia artificial tenemos un equipo experto en inteligencia artificial para empresas

Teachable Machine en pocas palabras: la plataforma funciona visualmente en tres pasos. Recolectar: mostrar ejemplos a la IA, por ejemplo fotos de cada letra en Libras. Entrenar: pulsar un botón y la herramienta aprende los patrones de cada clase. Exportar: descargar o enlazar el modelo ya entrenado para usarlo en una web o app. Es una forma práctica para validar ideas y prototipos antes de escalar a modelos más complejos

Entrenando el primer modelo: elegí un proyecto de imagen y definí clases como letra A y letra B. Con la webcam fui capturando varias fotos por clase. Un consejo práctico: no tomes todas las fotos igual; cambia ángulos, distancia y iluminación para que el modelo aprenda variaciones y generalice mejor. Tras recopilar suficientes imágenes inicié el entrenamiento y en segundos tuve un modelo listo para probar

Tecnologías esenciales: internamente Teachable Machine usa TensorFlow.js para ejecutar modelos directamente en el navegador y una biblioteca específica para imagen llamada teachablemachine-image que facilita cargar el modelo y enlazarlo con la webcam. Esto evita la necesidad inmediata de un servidor y facilita prototipos rápidos

Cómo funciona el flujo en la web: el navegador descarga la arquitectura y pesos del modelo desde una URL pública, carga la webcam y ejecuta un bucle en tiempo real. En cada iteración se obtiene el frame actual, se envía al modelo para inferencia y el resultado se muestra en pantalla con probabilidades por cada clase. Esa cadena init, loop, predict y display se repite decenas de veces por segundo para ofrecer retroalimentación en vivo

Resultados y retos: el prototipo funcionó sorprendentemente bien en condiciones controladas. Gestos bien definidos y buena iluminación arrojaron precisiones superiores al 95 y la respuesta en tiempo real fue fluida. Sin embargo aparecieron limitaciones: cambios en la luz, fondos complejos y gestos muy similares confunden al modelo. Esto demuestra la importancia de datos de entrenamiento diversos y de estrategias de mejora como aumento de datos, modelos más robustos o sensores adicionales

Próximos pasos técnicos: reconocer palabras completas en Libras implica identificar secuencias de gestos y por tanto tratar señal temporal. Las soluciones pasan por modelos que procesen secuencias de frames, arquitecturas que integren visión y temporalidad, o agentes IA que orquesten modelos especializados. En Q2BSTUDIO aplicamos enfoques combinados incluyendo servicios cloud para escalar inferencia, pipelines de datos y modelos para empresas

Servicios complementarios: además de desarrollo de la solución de visión, un proyecto completo suele requerir ciberseguridad para proteger datos, servicios cloud aws y azure para despliegue y escalado, y servicios inteligencia de negocio o power bi para explotar métricas y resultados. Nuestra experiencia cubre desde pentesting hasta integración con plataformas de BI para convertir resultados en información accionable

Reflexión final: crear un reconocedor de Libras con herramientas como Teachable Machine demuestra que la IA está al alcance de equipos y empresas que quieren construir productos inclusivos. No se trata solo de modelos, sino de diseño, calidad de datos y un enfoque integral que combine desarrollo de software a medida, inteligencia artificial y seguridad. Si te interesa avanzar con un proyecto similar en Q2BSTUDIO podemos acompañarte desde el prototipo hasta el producto final, integrando aplicaciones a medida, agentes IA, servicios cloud y analítica con power bi

Si quieres hablar de un proyecto, recibir una consultoría o explorar cómo convertir un prototipo en una solución escalable contacta con nuestro equipo y descubre cómo la tecnología puede ser una herramienta real para la inclusión y la transformación digital