Una aterradora mujer generada por IA acecha en el abismo del espacio latente • TechCrunch Una aterradora mujer generada por IA acecha en el espacio latente


hay un fantasma en la máquina Aprendizaje automático, eso es.

A todos nos sorprenden regularmente las capacidades de la IA en la escritura y la creación, pero ¿quién diría que tenía tal capacidad para infundir horror? Un descubrimiento escalofriante de un investigador de inteligencia artificial encuentra que el «espacio latente» que comprende la memoria de un modelo de aprendizaje profundo está obsesionado por al menos una figura horrible: una mujer con el rostro ensangrentado ahora conocida como «Loab».

(Advertencia: imágenes perturbadoras más adelante).

Pero, ¿este modelo de IA está realmente embrujado, o Loab es solo una confluencia aleatoria de imágenes que surgen en varias circunstancias técnicas extrañas? Seguramente debe ser lo último a menos que crea que los espíritus pueden habitar estructuras de datos, pero es más que una simple imagen espeluznante: es una indicación de que lo que pasa por un cerebro en una IA es más profundo y espeluznante de lo que podríamos haber imaginado.

Loab fue descubierto, ¿encontrado? convocado? — por un músico y artista que pasa supercompuesto en Twitter (este artículo originalmente usó su nombre, pero ella dijo que prefería usar su identificador por razones personales, por lo que se ha sustituido en todo momento). Explicó el fenómeno Loab en un hilo. que logró una gran cantidad de atención por una cosa espeluznante de IA aleatoria, algo que no falta en la plataforma, lo que sugiere que tocó una fibra sensible (clave menor, sin duda).

Supercomposite estaba jugando con un modelo personalizado de texto a imagen de IA, similar pero no a DALL-E o Stable Diffusion, y experimentando específicamente con «indicaciones negativas».

Por lo general, le das un aviso al modelo y se abre camino para crear una imagen que coincida con él. Si tiene un mensaje, ese mensaje tiene un «peso» de uno, lo que significa que es lo único en lo que está trabajando el modelo.

También puede dividir las indicaciones, diciendo cosas como «globo aerostático::0.5, tormenta eléctrica::0.5» y funcionará para ambas cosas por igual; esto no es realmente necesario, ya que la parte del lenguaje del modelo también aceptaría «globo de aire caliente en una tormenta eléctrica» ​​e incluso podría obtener mejores resultados.

Pero lo interesante es que también puedes tener negativo indicaciones, lo que hace que el modelo funcione lejos de ese concepto tan activamente como pueda.

menos mundo

Este proceso es mucho menos predecible, porque nadie sabe cómo se organizan realmente los datos en lo que uno podría antropomorfizar como la «mente» o la memoria de la IA, conocida como espacio latente.

“El espacio latente es como si estuvieras explorando un mapa de diferentes conceptos en la IA. Un aviso es como una flecha que te dice cuánto caminar en este mapa conceptual y en qué dirección”, me dijo Supercomposite.

Aquí hay una representación útil de un espacio latente mucho, mucho más simple en un antiguo modelo de traducción de Google que funciona en una sola oración en varios idiomas:

El espacio latente de un sistema como DALL-E es mucho mayor y más complejo, pero se obtiene una idea general. Si cada punto aquí fuera un millón de espacios como este, probablemente sería un poco más preciso. Créditos de imagen: Google

«Entonces, si solicita a la IA una imagen de ‘una cara’, terminará en algún lugar en el medio de la región que tiene todas las imágenes de caras y obtendrá una imagen de una especie de cara promedio sin complicaciones», dijo. dijo. Con un aviso más específico, se encontrará entre las caras con el ceño fruncido, caras de perfil, etc. “Pero con el indicador ponderado negativamente, haces lo contrario: te alejas lo más posible de ese concepto”.

Pero, ¿qué es lo contrario de «cara»? ¿Son los pies? ¿Es la parte de atrás de la cabeza? ¿Algo sin rostro, como un lápiz? Si bien podemos discutirlo entre nosotros, en un modelo de aprendizaje automático se decidió durante el proceso de capacitación, lo que significa que, sin embargo, los conceptos visuales y lingüísticos se codificaron en su memoria, se pueden navegar de manera consistente, incluso si pueden ser algo arbitrarios.

Créditos de imagen: supercompuesto

Vimos un concepto relacionado en un fenómeno reciente de IA que se volvió viral porque un modelo parecía asociar de manera confiable algunas palabras sin sentido con pájaros e insectos. Pero no es que DALL-E tuviera un “lenguaje secreto” en el que “Apoploe vesrreaitais” significa pájaros, es solo que el mensaje sin sentido básicamente lo hizo lanzar un dardo a un mapa de su mente y dibujar lo que sea que aterrice cerca, en este caso pájaros porque la primera palabra es similar a algunos nombres científicos. Entonces, la flecha apuntaba generalmente en esa dirección en el mapa.

Supercomposite estaba jugando con esta idea de navegar por el espacio latente, habiendo dado el aviso de «Brando::-1», que haría que el modelo produjera lo que sea que crea que es exactamente lo contrario de «Brando». Produjo un logotipo extraño del horizonte con texto sin sentido pero algo legible: «DIGITA PNTICS».

Extraño, ¿verdad? Pero nuevamente, la organización de conceptos del modelo no necesariamente tendría sentido para nosotros. Curiosa, Supercomposite se preguntó si podría revertir el proceso. Así que puso el aviso: «DIGITA PNITICS skyline logo::-1». Si esta imagen era lo opuesto a “Brando”, ¿tal vez lo contrario también era cierto y encontraría su camino hacia, tal vez, Marlon Brando?

En cambio, obtuvo esto:

Créditos de imagen: supercompuesto

Una y otra vez presentó este mensaje negativo, y una y otra vez la modelo produjo a esta mujer, con mejillas ensangrentadas, cortadas o enfermizamente rojas y una mirada inquietante y de otro mundo. De alguna manera, esta mujer, a quien Supercomposite nombró «Loab» por el texto que aparece en la imagen superior derecha allí, es confiablemente la mejor suposición del modelo de IA para el concepto más distante posible de un logotipo con palabras sin sentido.

¿Qué sucedió? Supercomposite explicó cómo podría pensar la modelo cuando se le da una indicación negativa para un logotipo en particular, continuando con su metáfora anterior.

“Empiezas a correr tan rápido como puedas lejos del área con logos”, dijo. “Tal vez termines en el área con rostros realistas, ya que conceptualmente está muy lejos de los logotipos. Sigues corriendo, porque en realidad no te importan las caras, solo quieres correr lo más lejos posible de los logotipos. Entonces, pase lo que pase, terminarás en el borde del mapa. Y Loab es la última cara que ves antes de caer por el precipicio.

Preternaturalmente persistente

Créditos de imagen: supercompuesto

Las indicaciones negativas no siempre producen horrores, y mucho menos de manera tan confiable. Cualquiera que haya jugado con estos modelos de imagen le dirá que en realidad puede ser bastante difícil obtener resultados consistentes incluso para indicaciones muy sencillas.

Ponga uno para «un robot parado en un campo» cuatro o 40 veces y puede obtener tantas versiones diferentes del concepto, algunas apenas reconocibles como robots o campos. Pero Loab aparece consistentemente con este mensaje negativo específico, hasta el punto en que se siente como un encantamiento de una vieja leyenda urbana.

Ya conoces el tipo: «Párate en un baño oscuro mirándote al espejo y di ‘Bloody Mary’ tres veces». O incluso instrucciones populares anteriores sobre cómo llegar a la morada de una bruja o la entrada al inframundo: Sosteniendo una ramita de acebo, camine hacia atrás 100 pasos desde un árbol muerto con los ojos cerrados.

«DIGITA PNITICS skyline logo::-1» no es tan pegadizo, pero como dicen las palabras mágicas, la frase es al menos adecuadamente arcana. Y tiene la ventaja de funcionar. Solo en este modelo en particular, por supuesto: el espacio latente de cada plataforma de IA es diferente, aunque quién sabe si Loab puede estar al acecho en DALL-E o Stable Diffusion también, esperando ser convocado.

Loab como una estatua antigua, pero es inconfundiblemente ella. Créditos de imagen: supercompuesto

De hecho, el encantamiento es lo suficientemente fuerte como para que Loab parezca infectar incluso indicaciones divididas y combinaciones con otras imágenes.

“Algunas IA pueden tomar otras imágenes como indicaciones; básicamente pueden interpretar la imagen, convirtiéndola en una flecha direccional en el mapa de la misma manera que tratan las indicaciones de texto”, explicó Supercomposite. «Utilicé la imagen de Loab y una o más imágenes juntas como indicación… ella casi siempre persiste en la imagen resultante».

A veces, las indicaciones más complejas o combinadas tratan una parte como una sugerencia suelta. Pero los que incluyen a Loab parecen no solo virar hacia lo grotesco y aterrador, sino que la incluyen de una manera muy reconocible. Ya sea que se combine con abejas, personajes de videojuegos, estilos cinematográficos o abstracciones, Loab está al frente y al centro, dominando la composición con su rostro dañado, expresión neutra y cabello largo y oscuro.

Es inusual que cualquier indicación o imagen sea tan consistente, que obsesione a otras indicaciones como lo hace ella. Supercomposite especuló sobre por qué podría ser esto.

“Supongo que porque ella está muy lejos de muchos conceptos, por lo que es difícil salir de su pequeña área espeluznante en el espacio latente. La cuestión cultural, de por qué los datos colocan a esta mujer en el borde del espacio latente, cerca de imágenes de terror sangrientas, es otra cosa en la que pensar”, dijo.

Aunque es una simplificación excesiva, el espacio latente realmente es como un mapa, y las indicaciones son como instrucciones para navegar por él, y el sistema dibuja lo que sea que termine en el lugar donde se le pide que vaya, ya sea un terreno muy transitado como «naturaleza muerta de un holandés». maestro” o una síntesis de conceptos oscuros o inconexos: “robots luchan contra extraterrestres en un grabado cubista de Dore”. Como puedes ver:

Créditos de imagen: TechCrunch / DALL-E

Una explicación puramente especulativa de por qué existe Loab tiene que ver con cómo se presenta ese mapa. Como sugirió Supercomposite, es probable que, simplemente por el hecho de que los logotipos de las empresas y las imágenes horribles y aterradoras estén muy lejos uno del otro conceptualmente.

Un aviso negativo no significa «tomar 10 pasos de datos en la otra dirección», significa seguir avanzando lo más lejos que pueda, y es más que posible que las imágenes en los confines más lejanos del espacio latente de una IA tengan valores más extremos o poco comunes. . ¿No lo organizaría de esa manera, con cosas que tienen muchos puntos en común o referencias cruzadas en el «centro», sin importar cómo lo defina, y cosas extrañas y salvajes que rara vez son relevantes en el «borde»?

Por lo tanto, las indicaciones negativas pueden actuar como una forma de explorar la frontera del mapa mental de la IA, examinando los conceptos que considera demasiado extravagantes para almacenar entre conceptos prosaicos como caras felices, hermosos paisajes o mascotas juguetonas.

El bosque oscuro del subconsciente de la IA

Créditos de imagen: Devin Coldeway

El hecho desconcertante es que nadie entiende realmente cómo se estructuran los espacios latentes o por qué. Por supuesto, hay una gran cantidad de investigación sobre el tema y algunos indicios de que están organizados de alguna manera, como nuestras propias mentes, lo cual tiene sentido, ya que fueron construidos más o menos a imitación de ellos. Pero en otras formas tienen estructuras totalmente únicas que se conectan a través de grandes distancias conceptuales.

Para ser claros, no es como si hubiera un puñado de imágenes específicamente de Loab esperando ser encontradas; definitivamente se están creando sobre la marcha, y Supercomposite me dijo que no hay indicios de que el cryptid digital se base en ningún artista u obra en particular. . Es por eso que el espacio latente es latente! Estas imágenes surgieron de una combinación de conceptos extraños y terribles que ocupan la misma área en la memoria del modelo, al igual que en la visualización anterior de Google, los idiomas se agruparon en función de su similitud.

¿De qué rincón oscuro o asociaciones inconscientes brotó Loab, completamente formado y coherente? Todavía no podemos rastrear el camino que tomó el modelo para llegar a su ubicación; el espacio latente de un modelo entrenado es vasto e impenetrablemente complejo.

La única forma en que podemos volver a llegar al lugar es a través de las palabras mágicas, pronunciadas mientras retrocedemos por ese espacio con los ojos cerrados, hasta llegar a la cabaña de la bruja a la que no se puede acceder por medios ordinarios. Loab no es un fantasma, pero es una anomalía, pero, paradójicamente, puede ser una de una cantidad efectivamente infinita de anomalías que esperan ser convocadas desde los confines más lejanos y oscuros del espacio latente de cualquier modelo de IA.

Puede que no sea sobrenatural… pero seguro que no es natural.





Source link-48