Investigadores de la Universidad Carnegie Mellon han estado probando un sistema que utiliza señales Wi-Fi para determinar la posición y la pose de los humanos en una habitación. En las pruebas, los enrutadores Wi-Fi comunes, específicamente los dispositivos TP-Link Archer A7 AC1750, se colocaron en cada extremo de la sala, junto con varios números de personas en la sala. Los algoritmos impulsados por IA analizaron la interferencia de la señal Wi-Fi generada por las personas.
Las imágenes de estructura alámbrica generadas a partir del monitoreo de Wi-Fi parecían bastante precisas en la mayoría de los casos, y los investigadores afirmaron que las estimaciones son tan buenas como algunos «enfoques basados en imágenes». También hay algunas ventajas y atracciones para usar Wi-Fi sobre cámaras. En primer lugar, las estimaciones de estructura alámbrica de la pose humana son más respetuosas con la privacidad humana. En segundo lugar, la percepción basada en Wi-Fi no requiere luz y es capaz de detectar posturas corporales incluso cuando hay objetos en el camino que oscurecerían la vista de una cámara tradicional. Otro gran atractivo de este descubrimiento es que los enrutadores Wi-Fi utilizados eran baratos a solo $ 30 cada uno y, por lo tanto, mucho más accesibles que las soluciones costosas y que consumen mucha energía, como el radar y LiDAR.
Arriba puede ver un conjunto de imágenes sincronizadas, con las imágenes fijas de video a la izquierda y los wireframes detectados por Wi-Fi generados por IA a la derecha. La detección de la cantidad de personas, ubicaciones y poses parece muy precisa. El artículo publicado por los investigadores de Carnegie Mellon proporciona algunos antecedentes detallados sobre cómo se hace esto. En resumen, la tecnología de percepción basada en Wi-Fi que se muestra aquí se basa en la información del estado del canal (CSI) de la señal Wi-Fi, que representa la relación entre la onda de la señal transmitida y la onda de la señal recibida. Estos datos se procesan utilizando una arquitectura de red neuronal inteligente de visión por computadora que puede realizar una estimación de pose densa. Para simplificar y, por lo tanto, acelerar la generación de representaciones humanas de estilo alámbrico, los investigadores dividieron la forma humana en 24 segmentos.
Los investigadores admiten que el método descrito anteriormente para detectar humanos y su posicionamiento / poses no está exento de problemas, y todavía ven algunos errores obvios en los escenarios de prueba. Gentilmente proporcionaron algunas imágenes de comparación que muestran «casos de fallas», que atribuyen a problemas como que los humanos hacen poses inusuales y que hay demasiados sujetos en la habitación a la vez (el motor admite de manera óptima a tres personas o menos).
Todavía queda mucho trabajo por hacer, y los investigadores sugieren que la técnica descrita podría mejorarse de varias maneras, pero principalmente a partir de mejores datos de capacitación pública para la percepción basada en Wi-Fi, especialmente en diferentes diseños de salas. Si bien se promociona como una forma sensible a la privacidad de monitorear la seguridad de las personas mayores que viven solas, y es una solución muy asequible para este propósito, sin duda algunos estarán preocupados por la nueva amenaza de que su enrutador Wi-Fi los espíe.