¿Una Alexa feminista? Cómo los estudiantes crearon un asistente de IA más progresivo


Hablar con nuestros dispositivos se está convirtiendo en la forma predeterminada de pedir direcciones, recomendaciones de restaurantes, horarios de películas y el clima, según datos de Microsoft(Se abre en una nueva ventana). De las 2000 personas encuestadas, el 72 % de los usuarios de asistentes digitales dijeron que preferían las solicitudes basadas en la voz.

Y aunque Alexa no ha sido exactamente una fuente de ingresos(Se abre en una nueva ventana) para Amazon, está claro que los asistentes virtuales se están volviendo cada vez más integrales en nuestras vidas digitales.

Pero hay un problema en cómo se nos presentan estas IA activadas por voz. En caso de que no lo hayas notado, las voces predeterminadas para Alexa de Amazon, Siri de Apple y el Asistente de Google son todas femeninas. Ahora puede seleccionar voces masculinas, pero parece que los tecnólogos han diseñado abrumadoramente a los asistentes de voz como «no masculinos».

Otros ejemplos de la industria incluyen AMELIA de IPSoft y SILVIA de Cognitive Code, que se integró en el sistema de simulación de Northrop Grumman, SADIE. Por supuesto, la precursora de todas ellas fue ELIZA(Se abre en una nueva ventana)el bot de la década de 1960 dentro del sistema de tiempo compartido del MIT.

¿Importa que todos sean de género? Bueno, ellos están percibidos como meros «asistentes» para cumplir con nuestras órdenes humanas, por lo que no es exactamente empoderador. ¿Están las grandes empresas de tecnología perpetuando estereotipos y reforzando el sesgo negativo (oculto o manifiesto) al retratar sus IA como «femeninas»? Podría decirse que sí.

Entonces la pregunta debe ser: ¿Existe un mejor enfoque para construir IA activada por voz? ¿Cuáles son los pasos para diseñar un asistente que no sólo sea más allá del género, pero ¿tiene valores más progresistas impulsando su funcionalidad? ¿Y hay formas de construir una IA para comunidades específicas, como usuarios queer y trans?


Diseñando una Alexa feminista

(Crédito: Instituto de Computación Creativa)

Estas son las preguntas que los estudiantes abordaron en el programa Designing a Feminist Alexa del Creative Computing Institute(Se abre en una nueva ventana) dentro de la Universidad de las Artes de Londres. Cuarenta estudiantes de la UAL se reunieron con un grupo de dispositivos Alexa y el servicio de voz Alexa de Amazon(Se abre en una nueva ventana) herramientas, para un taller de tres días. ¿Su misión? Imaginar y crear prototipos de asistentes personales inteligentes que satisfagan una necesidad humana significativa y encarnen valores feministas.

Para iniciar el debate sobre lo que constituye un diálogo de tendencia feminista para un asistente de IA, los estudiantes utilizaron las preguntas planteadas en el Proceso de diseño de chatbot feminista(Se abre en una nueva ventana). Esto surgió de una investigación realizada por josie joven(Se abre en una nueva ventana) (ahora Gerente de Programas en Microsoft en el Xbox Trust Team) durante su Maestría en Goldsmiths, Universidad de Londres.

Cubre todo, desde examinar la ética detrás de cada elección de plataforma tecnológica, hasta desarrollar un personaje sin género que les recuerde a los usuarios que es un robot (para evitar cualquier sesgo o prejuicio), proteger los almacenes de datos y obtener comentarios para entrenar a la IA mientras mejora su comprensión del tarea en cuestión.

Luego, las alumnas del curso Alexa Feminista se pusieron manos a la obra y se separaron en equipos. Cada equipo hizo una lluvia de ideas sobre una persona para su asistente, que satisfaría las necesidades de los usuarios finales propuestos. Básicamente, se trata de crear un personaje con el que su público se sienta cómodo hablando.

Durante este proceso, también idearon patrones de diálogo de consulta y respuesta de muestra para reforzar el «carácter» de su persona (que se desarrollaría más en la etapa de diseño de conversación). Por ejemplo, cómo respondería su inteligencia artificial cuando no entendiera una pregunta.

Luego avanzaron hacia la creación de todas las permutaciones posibles de chat de ida y vuelta entre un bot de tendencia feminista y su contraparte humana (nota: terminología neutral de género allí).


flujo de voz

(Crédito: flujo de voz)

CxD es un conjunto de habilidades de diseño multimodal, que consiste en diseño de interacción de usuario de voz, diseño de interfaz, diseño de movimiento, diseño visual y escritura UX. No se trata solo de las «indicaciones» (que incluyen palabras clave para que la IA sepa que el humano ha hecho una pregunta específica) o el flujo de conversación (para evitar «Lo siento, no entendí eso») sino que también refuerza la voz del asistente.

Hay muchas herramientas en el mercado para el diseño de conversaciones, incluido Voiceflow(Se abre en una nueva ventana)acciones específicas de la plataforma para el Asistente de Google(Se abre en una nueva ventana)y habilidades para Alexa.(Se abre en una nueva ventana) Los equipos de la UAL primero trazaron las conversaciones como un diagrama de flujo, usando Whimsical(Se abre en una nueva ventana)para asegurarse de que habían cubierto todas las rutas y respuestas posibles dentro de la etapa de gestión del diálogo.

CxD se parece a la escritura de guiones visuales, pero también requiere una excelente comprensión espacial para «ver» la conversación, con todas sus «ramas», a medida que se desvía hacia diferentes áreas temáticas, mientras se diseña en la pantalla. El asistente también es tan bueno como la base de conocimientos en la que se basa. No puede decirle a qué no puede acceder en la web.

Cathy perla(Se abre en una nueva ventana)director de diseño del Asistente de Google y autor de Diseño de interfaces de usuario de voz(Se abre en una nueva ventana) tiene un buen video explicativo(Se abre en una nueva ventana) sobre cómo crear un script para un asistente virtual, incluida la realización de una «lectura de tabla» y cómo manejar las respuestas inesperadas de los usuarios.

Alternativamente, uno puede codificar una IA conversacional desde cero, usando Python para el flujo de diálogo.(Se abre en una nueva ventana), para ejecutarlo en un dispositivo Android con el Asistente de Google. Para obtener más información sobre cómo funciona, consulte Priyanka Vergadia, asesora de desarrolladores del personal de Google.(Se abre en una nueva ventana)El video de arriba.

Todo depende de su nivel de complejidad requerido. Algo así como Voiceflow es similar a usar WordPress para crear un sitio web, en el sentido de que el tablero lo guía a través del proceso sin código basado en bloques. Python es, bueno, más difícil.


Opciones de voz

Mientras los chatbots escriben y responden, los asistentes virtuales hablan. Esto significa que necesitan un estilo de vocalización. Hay varias maneras de hacer esto. La opción más laboriosa y de baja tecnología es registrar todas las respuestas posibles a la consulta humana. Menos tiempo, pero no tan agradable para el oído humano, es usar la concatenación, que implica grabar palabras individuales y luego unirlas para formar oraciones cohesivas.

La mayoría de los asistentes de IA en este momento usan voces sintéticas dentro de los programas de texto a voz, como Amazon Polly(Se abre en una nueva ventana). La IA «lee» el guión en segundo plano y escuchamos la respuesta vocalizada. Algunos TTS (los más caros) se pueden entrenar para modular sus patrones de voz para que suenen más convincentes que otros.

Un método más futurista es implementar la síntesis de voz para capturar el espectro completo de fonemas de una voz humana en lugar de grabar sílabas individuales. Vi esto hecho en 2016 en ObEN, una compañía que da voz a actores para conserjes de robots en Las Vegas y talento en pantalla en toda Asia. Lo inteligente de capturar la voz a nivel de fonemas es que el asistente virtual puede hablar cualquier idioma: son solo 1 y 0 para la IA.


Exportación a plataformas

A diferencia de la web con sus estándares abiertos, los asistentes de IA siguen siendo una tecnología incipiente y algo patentada, por lo que los desarrolladores deben elegir una plataforma en la que ejecutar su software. Por ejemplo, usar Alexa requiere una cuenta de desarrollador de Alexa(Se abre en una nueva ventana)luego probando la IA en Alexa Developer Console(Se abre en una nueva ventana) (entorno de simulación) antes de ejecutarlo localmente en un dispositivo Alexa.

Para asistentes de voz más específicos, que se ejecutan como «acciones» en el Asistente de Google (en dispositivos Android), los desarrolladores pueden registrarse para obtener una cuenta de prueba.(Se abre en una nueva ventana) con Google y sigue las instrucciones. Pero volvamos (virtualmente) a la UAL y su curso Alexa Feminista para la etapa final.


prototipos

prototipos feministas de IA

(Crédito: Instituto de Computación Creativa de la UAL)

Al final, las alumnas de la UAL del curso Alexa Feminista dieron con ocho prototipos, entre ellos Bud(Se abre en una nueva ventana)Holafuturo(Se abre en una nueva ventana)y Egami(Se abre en una nueva ventana)que demostró empoderamiento, consejos de vida, carrera, bienestar y educación sexual informados por el feminismo.

Todos los prototipos mostraron una voz confiada y un tono sin prejuicios (p. ej., «Nada es demasiado extraño para mí. Soy un bot. ¿Qué tienes en mente?»); aplaudir cuando se enfrentan a abusos por parte de los usuarios (por ejemplo, «Por favor, sea cortés. No soy un ser humano, pero el abuso no es aceptable de ninguna manera o forma») y establecer límites (por ejemplo, «Buena suerte con el uso de ese lenguaje en sus entrevistas de trabajo». )

Fue refrescante escuchar los diversos prototipos en acción porque no se parecían en nada a las IA de facto que había escuchado antes. Después de que terminó el programa Designing a Feminist Alexa, la UAL decidió apoyar una mayor investigación sobre las IA progresivas y si se podría hacer una específicamente para personas trans y/o no binarias.


Syb: IA de voz queering

sib IA

(Crédito: Internet feminista)

En 2020, otro grupo de estudiantes, la mayoría de los cuales se identificaron como trans y/o no binarios, se reunieron durante una semana en el Creative Computing Institute para crear Syb.(Se abre en una nueva ventana)un prototipo para apoyar a las personas trans como parte de Queering Voice AI: Trans Cenetred Design(Se abre en una nueva ventana) curso, bajo la guía de los líderes del curso Andrew Mallinson, co-fundador de Feminist Internet(Se abre en una nueva ventana)y Cami Rincòn, quien ahora es Investigadora de Ética de AI(Se abre en una nueva ventana) en el Instituto Alan Turing de Londres (que PCMag visitó en 2019).

“El propósito y el proceso de diseño de los dos cursos estaban alineados”, dijo Rincòn a PCMag. “Pero el nuestro era bastante diferente en el sentido de que buscábamos desarrollar un prototipo, basado en los requisitos de diseño obtenidos a través de mi estudio académico.(Se abre en una nueva ventana) en las necesidades y experiencias de usuarios trans y/o no binarios de VAI [Voice Activated AIs].”

Con este fin, el diseño conversacional de Syb fue explícitamente progresista en el uso de un lenguaje y tono de afirmación de género, así como en su base de conocimientos. El caso de uso desarrollado por los estudiantes fue acerca de conectar a las personas trans con los medios (películas, televisión, etc.) recomendados por su comunidad.

En 2021, Syb recibió la New New Fellowship inaugural(Se abre en una nueva ventana), lo que permitió al equipo de diseño refinar el prototipo y llevarlo a un público más amplio. Si bien los prototipos de Feminist Alexa no están disponibles para su uso público, Syb tiene un prototipo inicial que puede probar en versión beta.(Se abre en una nueva ventana).


Asistentes virtuales en el futuro

Recientemente me di cuenta de que los asistentes de IA actuales están diseñados para ser soluciones amplias para el público en general. Están destinados a responder preguntas de bases de datos de conocimiento colectivo, como Wikipedia (que tiene sus propios problemas de veracidad y sesgo), o para extraer contenido digital (detalles de restaurantes, direcciones de mapas, clima y noticias).

He usado el Asistente de Google para leer mi horario y, ocasionalmente, ubicar a alguien en mi lista de llamadas o enviar un mensaje de texto (pero siempre tengo que asegurarme de que me escuche correctamente). Me gustaría un asistente de IA que se base en mis propias reservas de conocimiento cada vez mayores, para que pueda crecer y aprender conmigo.

No porque me preocupe específicamente perder la cabeza (clínicamente o de otra manera), sino porque quiero una interfaz de IA basada en voz para mi vida. Algo que me sugiere películas que podría querer ver, libros para leer (y luego solicita automáticamente el préstamo del libro electrónico de la biblioteca local), me recuerda cuándo se acercan los cumpleaños y fechas importantes, y me permite saber qué compré el año pasado para evitar problemas de re-regalo.

Un verdadero asistente personal virtual; no es una herramienta genérica, sino una IA que se adapta a mí, con una voz realmente genial. Aprender más sobre el trabajo en la UAL me inspiró a pensar más allá de los sospechosos habituales, hacia un futuro en el que una miríada de IA incorpóreas, verdaderamente progresistas y más allá del género, podría proporcionar una interfaz activada por voz realmente útil para nuestras vidas cada vez más híbridas.

¡Obtenga nuestras mejores historias!

Matricularse en ¿Qué hay de nuevo ahora? para recibir nuestras mejores historias en su bandeja de entrada todas las mañanas.

Este boletín puede contener publicidad, ofertas o enlaces de afiliados. Suscribirse a un boletín informativo indica su consentimiento a nuestros Términos de uso y Política de privacidad. Puede darse de baja de los boletines en cualquier momento.





Source link-38