{"id":189455,"date":"2022-09-24T03:46:41","date_gmt":"2022-09-24T03:46:41","guid":{"rendered":"https:\/\/magazineoffice.com\/use-la-nueva-tecnologia-de-openai-para-transcribir-audio-directamente-en-mi-computadora-portatil\/"},"modified":"2022-09-24T03:46:43","modified_gmt":"2022-09-24T03:46:43","slug":"use-la-nueva-tecnologia-de-openai-para-transcribir-audio-directamente-en-mi-computadora-portatil","status":"publish","type":"post","link":"https:\/\/magazineoffice.com\/use-la-nueva-tecnologia-de-openai-para-transcribir-audio-directamente-en-mi-computadora-portatil\/","title":{"rendered":"Us\u00e9 la nueva tecnolog\u00eda de OpenAI para transcribir audio directamente en mi computadora port\u00e1til"},"content":{"rendered":"


\n<\/p>\n

\n
\n

OpenAI, la empresa detr\u00e1s de la generaci\u00f3n de im\u00e1genes y la generaci\u00f3n de memes programa DALL-E<\/a> y el potente motor de autocompletado de texto GPT-3,<\/a> ha lanzado una nueva red neuronal de c\u00f3digo abierto destinada a transcribir audio en texto escrito (a trav\u00e9s de TechCrunch<\/em><\/a>). Se llama Susurro, y la empresa dice<\/a> \u201cse acerca a la solidez y precisi\u00f3n del nivel humano en el reconocimiento de voz en ingl\u00e9s\u201d y que tambi\u00e9n puede reconocer, transcribir y traducir autom\u00e1ticamente otros idiomas como espa\u00f1ol, italiano y japon\u00e9s.<\/p>\n<\/div>\n

\n

Como alguien que constantemente graba y transcribe entrevistas, esta noticia me entusiasm\u00f3 de inmediato: pens\u00e9 que podr\u00eda escribir mi propia aplicaci\u00f3n para transcribir audio de forma segura directamente desde mi computadora. Si bien los servicios basados \u200b\u200ben la nube como Otter.ai y Trint funcionan para la mayor\u00eda de las cosas y son relativamente seguros, solo hay algunas entrevistas en las que yo o mis fuentes sentirse m\u00e1s c\u00f3modo<\/a> si el archivo de audio permaneci\u00f3 fuera de Internet.<\/p>\n<\/div>\n

\n

Usarlo result\u00f3 ser a\u00fan m\u00e1s f\u00e1cil de lo que hab\u00eda imaginado; Ya tengo Python y varias herramientas de desarrollo configuradas en mi computadora, por lo que instalar Whisper fue tan f\u00e1cil como ejecutar un solo comando de Terminal. En 15 minutos, pude usar Whisper para transcribir un clip de audio de prueba que hab\u00eda grabado. Para alguien relativamente experto en tecnolog\u00eda que a\u00fan no ten\u00eda Python, FFmpeg, Xcode y Homebrew configurados, probablemente tomar\u00eda cerca de una hora o dos. Sin embargo, ya hay alguien trabajando para hacer que el proceso sea mucho m\u00e1s simple y f\u00e1cil de usar, del que hablaremos en un segundo.<\/p>\n<\/div>\n

\n
\n