Aquí en PC Gamer nos interesa la tecnología accesible. Cualquier cosa que pueda reducir los sentimientos de aislamiento después de un largo par de años es un aumento bienvenido, si me preguntas. Entonces, no es de extrañar que Tom Pritsky se haya vuelto viral en TikTok con un pequeño dispositivo AR que transcribirá tus conversaciones en tiempo real. Subtítulos de la vida real, por así decirlo.
Pritsky, junto con el cofundador Madhav Lavakare, formaron TranscribeGlass en 2021 para que las personas sordas y con problemas de audición no tuvieran que leer los labios.
Promocionando una característica similar a la que el viejo Google Glass había planeado traernos, TranscribeGlass agrega un pequeño accesorio de realidad aumentada al costado de un par de anteojos ordinarios que no solo transcribe las palabras que dice la persona frente a usted, sino que pero se las arregla para ignorar hábilmente las conversaciones circundantes que de otro modo podrían confundir la transcripción.
El objetivo de Pritsky es audaz: «Resolver la pérdida auditiva». Fue el fundador del «primer club de Stanford dedicado a la defensa de la pérdida auditiva», y está claro que su pasión por la tecnología ha crecido junto con el esfuerzo a lo largo de su carrera, y ahora converge aquí con TranscribeGlass.
Hablando con Jason Carman de Saturday Startup Stories, dice que «incluso si le dio a alguien el audífono perfecto, el sistema auditivo averiado no puede resolver ese audio, y suena súper borroso y difícil de entender».
Estudiantes de la Universidad de Stanford desarrollaron anteojos que transcriben el habla en tiempo real para personas sordas. Asombroso. El producto se llama TranscribeGlass. pic.twitter.com/uvXVOU7czd27 de julio de 2023
Eludiendo ese problema por completo, su diseño y el de Lavakare simplemente presentan al usuario la transcripción en el costado de la pantalla, para que pueda concentrarse en la conversación sin dejar de mirar a la persona con la que está hablando.
Debo decir que el tamaño de la pantalla es un poco pequeño, con algunas palabras más largas divididas en dos líneas separadas. Con suerte, también podrás cambiar el estilo de fuente.
Lo realmente bueno del proyecto es que puedes integrarlo con cualquier cosa. «Nuestro objetivo es ser independientes de la fuente», dice Pritsky. “Podemos integrar cualquier API: Google Speech, Deepgram, Microsoft”.
De código abierto y altamente accesible, se espera que el modelo final cueste alrededor de $ 95, y la tecnología mejora cada vez que lo veo.
Este es sin duda uno a tener en cuenta si eres el tipo de persona que se emociona con cosas como los trajes hápticos que brindan a los asistentes sordos al concierto una forma de experimentar la música.