IA que lee mis parpadeos y habla código Morse

Imagina poder hablar solo con los ojos. Parece ciencia ficcion, pero al ver en el navegador un sistema de inteligencia artificial que trazaba 478 puntos en mi rostro en tiempo real, esa idea se volvió palpable. Un malla blanca seguia cada contorno, detectando la posicion exacta de labios, mejillas y la punta de la nariz, incluso cuando parpadeaba. Decidi convertir esos parpadeos en codigo Morse para cumplir un sueño de toda la vida. El resultado fue mucho mas duro e interesante de lo que esperaba y ademas estuvo inspirado por la historia real de Jeremiah Denton, piloto estadounidense que, como prisionero, parpadeo la palabra TORTURE en codigo Morse durante un video de propaganda. Quise recrear esa ingeniosidad humana en una version digital y abierta.
La pila tecnologica es sorprendentemente sencilla: JavaScript con modulos ES6 para la logica, MediaPipe Face Landmarker para la deteccion de puntos faciales y blendshapes en tiempo real, y HTML5 y CSS3 para la interfaz sin frameworks complejos. Con estas piezas fue posible ejecutar todo directamente en el navegador sin hardware especializado.
Desafio 1 Detectar punto o raya Al principio el reto fue distinguir un punto de una raya en el parpadeo. MediaPipe ofrece puntuaciones en tiempo real para 52 expresiones faciales llamadas blendshapes, entre ellas eyeBlinkLeft y eyeBlinkRight. Un valor cercano a cero indica ojo abierto y cercano a uno ojo cerrado. En lugar de medir tiempo con setTimeout, que desincronizaba el bucle de video, la solucion fue contar frames consecutivos en los que el ojo aparece cerrado. Si el contador cae en un rango corto se interpreta como punto y si supera cierto umbral como raya. Contar frames resulta robusto y sincrono con requestAnimationFrame.
Desafio 2 Detectar asentimientos sin el ruido inicial Intentar detectar un asentimiento mirando la posicion y de la punta de la nariz frame a frame fue demasiado sensible al micro movimiento y a la respiracion. La solucion fue entender que un asentimiento es un recorrido y aplicar una ventana deslizante. Se mantiene un historico de las ultimas N posiciones Y de la nariz, se calcula min y max en esa ventana y si la diferencia supera un umbral habra un asentimiento intencional. Tambien se impone una cooldown para evitar detecciones consecutivas por el mismo gesto.
Desafio 3 Giro de cabeza usando la relacion mejilla a nariz Para detectar giros de cabeza y mapearlos a acciones como borrar o insertar espacios, observe que las proporciones relativas de la cara cambian al girar. Midiendo las coordenadas X de nariz y mejillas y calculando una proporcion entre la distancia nariz a mejilla derecha y el ancho total de ambas mejillas se obtiene una metrica que varia alrededor de 05 cuando la cabeza esta centrada, sube al mirar hacia la izquierda y baja al mirar a la derecha. Ese enfoque es simple, estable y evita el jitter que producen lecturas directas de posicion.
Lecciones practicas Este proyecto demuestra como la IA en el navegador es poderosa y accesible. Muchas soluciones complejas de antes requieren ahora solo algo de ingenio algoritimico y herramientas abiertas. Para empresas que quieran aplicar tecnologias similares en productos reales existen varias vias, desde crear interfaces con sensores tradicionales hasta desarrollar agentes IA que interpreten gestos y traduzcan intenciones en acciones automatizadas.
En Q2BSTUDIO somos una empresa de desarrollo de software especializada en aplicaciones a medida y software a medida, con experiencia en inteligencia artificial, ciberseguridad, servicios cloud aws y azure, servicios inteligencia de negocio y soluciones con Power BI. Podemos ayudarte a prototipar y llevar a produccion sistemas que combinan vision por ordenador, agentes IA y analitica avanzada. Si buscas desarrollar una plataforma basada en IA para empresas te invitamos a conocer nuestras propuestas de inteligencia artificial para empresas y si necesitas soluciones personalizadas de producto revisa nuestro servicio de desarrollo de aplicaciones y software a medida.
Aplicaciones y posibilidades Imagina interfaces accesibles para personas con movilidad reducida que hablen con los ojos, asistentes virtuales que combinen gestos y voz, o paneles de control seguros integrados con servicios cloud. Tambien hay cabida para agentes IA que automaticen procesos y para soluciones de inteligencia de negocio que analicen patrones de uso con Power BI. Naturalmente, todo esto debe construirse con criterios de seguridad y privacidad, que en Q2BSTUDIO abordamos con practicas de ciberseguridad y pruebas de pentesting.
Si te interesa este tipo de proyectos o quieres explorar como la vision por ordenador y la IA pueden mejorar tu producto, contanos tu idea. Que construyamos un prototipo que traduzca parpadeos a comandos o que desarrollemos un agente IA para automatizar tareas ser solo el comienzo.
Que harías tu con esta tecnologia Pregunta abierta para inspirar proyectos: prefieres crear una interfaz accesible, un asistente que use gestos, o una herramienta de analitica que combine vision y datos de negocio con Power BI y servicios cloud?
Comentarios