Deepfakes para garabatos: con la síntesis de escritura a mano, no se necesita bolígrafo


Agrandar / Un ejemplo de escritura a mano sintetizada por computadora generada por Calligrapher.ai.

Ars Technica

Gracias a una aplicación web gratuita llamada calligrapher.ai, cualquiera puede simular la escritura a mano con una red neuronal que se ejecuta en un navegador a través de JavaScript. Después de escribir una oración, el sitio la representa como escritura a mano en nueve estilos diferentes, cada uno de los cuales es ajustable con propiedades como velocidad, legibilidad y ancho de trazo. También permite descargar la muestra de escritura a mano falsa resultante en un archivo vectorial SVG.

La demostración es particularmente interesante porque no usa una fuente. Los tipos de letra que parecen escritos a mano existen desde hace más de 80 años, pero cada letra aparece como un duplicado sin importar cuántas veces la uses.

Durante la última década, los científicos informáticos han relajado esas restricciones al descubrir nuevas formas de simular la variedad dinámica de la escritura humana mediante redes neuronales.

Creado por el investigador de aprendizaje automático Sean Vasquez, el sitio web Calligrapher.ai utiliza la investigación de un artículo de 2013 de Alex Graves de DeepMind. Vasquez creó originalmente el sitio Calligrapher hace años, pero recientemente ganó más atención con un redescubrimiento en Hacker News.

Calligrapher.ai «dibuja» cada letra como si estuviera escrita por una mano humana, guiada por pesos estadísticos. Esos pesos provienen de una red neuronal recurrente (RNN) que se entrenó en la base de datos de escritura a mano en línea de IAM, que contiene muestras de escritura a mano de 221 personas digitalizadas desde una pizarra a lo largo del tiempo. Como resultado, el modelo de síntesis de escritura a mano de Calligrapher.ai está muy adaptado a la escritura en inglés, y la gente de Hacker News ha informado de problemas para reproducir los signos diacríticos que se encuentran comúnmente en otros idiomas.

Dado que el algoritmo que produce la escritura a mano es de naturaleza estadística, sus propiedades, como la «legibilidad», se pueden ajustar dinámicamente. Vásquez describió cómo funciona el control deslizante de legibilidad en un comentario en Hacker News en 2020: «Los resultados se muestrean a partir de una distribución de probabilidad, y aumentar la legibilidad concentra efectivamente la densidad de probabilidad en torno a los resultados más probables. Así que tiene razón en que solo está alterando la variación. El La técnica general se conoce como ‘ajustar la temperatura de la distribución de muestreo'».

Con las redes neuronales que ahora abordan texto, voz, imágenes, video y ahora escritura a mano, parece que ningún rincón de la producción creativa humana está fuera del alcance de la IA generativa.

En 2018, Vasquez proporcionó el código subyacente que impulsa la demostración de la aplicación web en GitHub, por lo que podría adaptarse a otras aplicaciones. En el contexto adecuado, podría ser útil para los diseñadores gráficos que desean más estilo que una fuente de script estática.



Source link-49