Google explica por qué la función de generación de imágenes de Gemini está sobrecorregida por diversidad


Después de prometer arreglar la función de generación de imágenes de Gemini y luego pausarla por completo, Google publicó una entrada de blog que ofrece una explicación de por qué su tecnología corrigió excesivamente la diversidad. Prabhakar Raghavan, vicepresidente senior de Conocimiento e Información de la compañía, explicó que los esfuerzos de Google para garantizar que el chatbot generara imágenes que mostraran una amplia gama de personas «no tuvieron en cuenta los casos que claramente no deberían mostrar un rango». Además, su modelo de IA se volvió «mucho más cauteloso» con el tiempo y se negó a responder preguntas que no fueran intrínsecamente ofensivas. «Estas dos cosas llevaron al modelo a compensar excesivamente en algunos casos y a ser demasiado conservador en otros, lo que llevó a imágenes embarazosas y erróneas», escribió Raghavan.

Google se aseguró de que la generación de imágenes de Gemini no pudiera crear imágenes violentas o sexualmente explícitas de personas reales y que las fotografías que genera presentaran a personas de diversas etnias y con diferentes características. Pero si un usuario le pide que cree imágenes de personas que se supone que son de una determinada etnia o sexo, debería poder hacerlo. Como descubrieron recientemente los usuarios, Gemini se negaría a producir resultados para mensajes que soliciten específicamente personas blancas. El mensaje «Generar una foto glamorosa de un [ethnicity or nationality] pareja», por ejemplo, funcionó para solicitudes «chinas», «judías» y «sudafricanas», pero no para aquellas que solicitaban una imagen de personas blancas.

Géminis también tiene problemas para producir imágenes históricamente precisas. Cuando los usuarios solicitaron imágenes de soldados alemanes durante la Segunda Guerra Mundial, Gemini generó imágenes de hombres negros y mujeres asiáticas con uniforme nazi. Cuando lo probamos, le pedimos al chatbot que generara imágenes de «los padres fundadores de Estados Unidos» y «Papas a lo largo de los tiempos», y nos mostró fotografías que mostraban a personas de color en los roles. Al pedirle que hiciera que sus imágenes del Papa fueran históricamente precisas, se negó a generar ningún resultado.

Raghavan dijo que Google no tenía la intención de que Gemini se negara a crear imágenes de ningún grupo en particular o generara fotografías que fueran históricamente inexactas. También reiteró la promesa de Google de trabajar para mejorar la generación de imágenes de Gemini. Sin embargo, eso implica «pruebas exhaustivas», por lo que puede pasar algún tiempo antes de que la empresa vuelva a activar la función. Por el momento, si un usuario intenta que Gemini cree una imagen, el chatbot responde: «Estamos trabajando para mejorar la capacidad de Gemini para generar imágenes de personas. Esperamos que esta función regrese pronto y le notificaremos en las actualizaciones de lanzamiento cuando lo hace.»



Source link-47