Una aterradora mujer generada por IA acecha en el abismo del espacio latente

Neto

hace 4 años

Una aterradora mujer generada por IA acecha en el abismo del espacio latente

Hay un fantasma en la máquina. Aprendizaje automático, eso es.

A todos nos sorprenden regularmente las capacidades de la IA en la escritura y la creación, pero ¿quién diría que tenía tal capacidad para infundir horror? Un descubrimiento escalofriante de un investigador de inteligencia artificial encuentra que el “espacio latente” que comprende la memoria de un modelo de aprendizaje profundo está obsesionado por al menos una figura horrible: una mujer con el rostro ensangrentado ahora conocida como “Loab”.

(Advertencia: imágenes perturbadoras más adelante).

Pero, ¿este modelo de IA está realmente embrujado, o Loab es solo una confluencia aleatoria de imágenes que surgen en varias circunstancias técnicas extrañas? Seguramente debe ser lo último a menos que crea que los espíritus pueden habitar estructuras de datos, pero es más que una simple imagen espeluznante: es una indicación de que lo que pasa por un cerebro en una IA es más profundo y espeluznante de lo que podríamos haber imaginado.

Loab fue descubierto, ¿encontrado? convocado? — por Steph Swanson, un músico y artista que pasa supercompuesto en Twitter. Explicó el fenómeno Loab en un hilo. que logró una gran cantidad de atención por una cosa espeluznante de IA aleatoria, algo que no falta en la plataforma, lo que sugiere que tocó una fibra sensible (clave menor, sin duda).

Swanson estaba jugando con un modelo personalizado de texto a imagen de IA, similar pero no a DALL-E o Stable Diffusion, y experimentando específicamente con “indicaciones negativas”.

Por lo general, le das un mensaje al modelo y se abre camino para crear una imagen que coincida con él. Si tiene un indicador, ese indicador tiene un “peso” de 1, lo que significa que es lo único en lo que está trabajando el modelo.

También puede dividir las indicaciones, diciendo cosas como “globo de aire caliente:: 0.5, tormenta:: 0.5” y funcionará para ambas cosas por igual; esto no es realmente necesario, ya que la parte del lenguaje del modelo también aceptaría “globo de aire caliente en una tormenta eléctrica” e incluso podría obtener mejores resultados.

Pero lo interesante es que también puede tener indicaciones negativas, lo que hace que el modelo se aleje de ese concepto de la forma más activa posible.

menos mundo

Este proceso es mucho menos predecible, porque nadie sabe cómo se organizan realmente los datos en lo que uno podría antropomorfizar como la “mente” o la memoria de la IA, conocida como espacio latente.

“El espacio latente es como si estuvieras explorando un mapa de diferentes conceptos en la IA. Un aviso es como una flecha que te dice cuánto caminar en este mapa conceptual y en qué dirección”, me dijo Swanson.

Aquí hay una representación útil de un espacio latente mucho, mucho más simple en un antiguo modelo de traducción de Google que funciona en una sola oración en varios idiomas:

El espacio latente de un sistema como DALL-E es mucho mayor y más complejo, pero se obtiene una idea general. Si cada punto aquí fuera un millón de espacios como este, probablemente sería un poco más preciso.

“Entonces, si solicita a la IA una imagen de ‘una cara’, terminará en algún lugar en el medio de la región que tiene todas las imágenes de caras y obtendrá una imagen de una especie de cara promedio sin complicaciones”, dijo. dijo. Con un aviso más específico, se encontrará entre las caras con el ceño fruncido, caras de perfil, etc. “Pero con el indicador ponderado negativamente, haces lo contrario: te alejas lo más posible de ese concepto”.

Pero, ¿qué es lo contrario de “cara”? ¿Son los pies? ¿Es la parte de atrás de la cabeza? ¿Algo sin rostro, como un lápiz? Si bien podemos discutirlo entre nosotros, en un modelo de aprendizaje automático se decidió durante el proceso de capacitación, lo que significa que, sin embargo, los conceptos visuales y lingüísticos se codificaron en su memoria, se pueden navegar de manera consistente, incluso si pueden ser algo arbitrarios.

Créditos de imagen: steph swanson

Vimos un concepto relacionado en un fenómeno reciente de IA que se volvió viral porque un modelo parecía asociar de manera confiable algunas palabras sin sentido con pájaros e insectos. Pero no era que DALL-E tuviera un “lenguaje secreto” en el que “Apoploe vesrreaitais” significa pájaros, es solo que el mensaje sin sentido básicamente lo tenía lanzando un dardo a un mapa de su mente y dibujando lo que cae cerca, en este caso pájaros porque la primera palabra es similar a algunos nombres científicos. Entonces, la flecha apuntaba generalmente en esa dirección en el mapa.

Swanson estaba jugando con esta idea de navegar por el espacio latente, después de haber dado el mensaje de “Brando::-1”, que haría que el modelo produjera lo que sea que crea que es exactamente lo contrario de “Brando”. Produjo un logotipo extraño del horizonte con texto sin sentido pero algo legible: “DIGITA PNTICS”.

Extraño, ¿verdad? Pero nuevamente, la organización de conceptos del modelo no necesariamente tendría sentido para nosotros. Curioso, Swanson se preguntó si podría revertir el proceso. Así que puso el aviso: “DIGITA PNITICS skyline logo::-1”. Si esta imagen era lo opuesto a “Brando”, ¿tal vez lo contrario también era cierto y encontraría su camino hacia, tal vez, Marlon Brando?

En cambio, obtuvo esto:

Créditos de imagen: steph swanson

Una y otra vez presentó este mensaje negativo, y una y otra vez la modelo produjo a esta mujer, con mejillas ensangrentadas, cortadas o enfermizamente rojas y una mirada inquietante y de otro mundo. De alguna manera, esta mujer, a quien Swanson llamó “Loab” por el texto que aparece en la imagen superior derecha allí, es confiablemente la mejor suposición del modelo de IA para el concepto más distante posible de un logotipo con palabras sin sentido.

¿Qué sucedió? Swanson explicó cómo podría pensar la modelo cuando se le da una indicación negativa para un logotipo en particular, continuando con su metáfora anterior.

“Empiezas a correr lo más rápido que puedas lejos del área con logos”, dijo. “Tal vez termines en el área con rostros realistas, ya que conceptualmente está muy lejos de los logotipos. Sigues corriendo, porque en realidad no te importan las caras, solo quieres correr lo más lejos posible de los logotipos. Entonces, pase lo que pase, terminarás en el borde del mapa. Y Loab es la última cara que ves antes de caer por el precipicio.

Preternaturalmente persistente

Créditos de imagen: steph swanson

Las indicaciones negativas no siempre producen horrores, y mucho menos de manera tan confiable. Cualquiera que haya jugado con estos modelos de imagen le dirá que en realidad puede ser bastante difícil obtener resultados consistentes incluso para indicaciones muy sencillas.

Ponga uno para “un robot parado en un campo” cuatro o cuarenta veces y puede obtener tantas interpretaciones diferentes del concepto, algunas difícilmente reconocibles como robots o campos. Pero Loab aparece consistentemente con este mensaje negativo específico, hasta el punto en que se siente como un encantamiento de una vieja leyenda urbana.

Ya conoces el tipo: “Párate en un baño oscuro mirándote al espejo y di ‘Bloody Mary’ tres veces”. O incluso instrucciones populares anteriores sobre cómo llegar a la morada de una bruja o la entrada al inframundo: sosteniendo una ramita de acebo, camine hacia atrás 100 pasos desde un árbol muerto con los ojos cerrados.

“DIGITA PNITICS skyline logo::-1” no es tan pegadizo, pero como dicen las palabras mágicas, la frase es al menos adecuadamente arcana. Y tiene la ventaja de funcionar. Solo en este modelo en particular, por supuesto: el espacio latente de cada plataforma de IA es diferente, aunque quién sabe, Loab puede estar al acecho en DALL-E o Stable Diffusion también, esperando ser convocado.

Loab como una estatua antigua, pero es inconfundiblemente ella.

De hecho, el encantamiento es lo suficientemente fuerte como para que Loab parezca infectar incluso indicaciones divididas y combinaciones con otras imágenes.

“Algunas IA pueden tomar otras imágenes como indicaciones, básicamente pueden interpretar la imagen, convirtiéndola en una flecha direccional en el mapa al igual que tratan las indicaciones de texto”, explicó Swanson. “Usé la imagen de Loab y una o más imágenes juntas como indicación… ella casi siempre persiste en la imagen resultante”.

A veces, las indicaciones más complejas o combinadas tratan una parte como una sugerencia suelta. Pero los que incluyen a Loab parecen no solo virar hacia lo grotesco y aterrador, sino que la incluyen de una manera muy reconocible. Ya sea que se combine con abejas, personajes de videojuegos, estilos cinematográficos o abstracciones, Loab está al frente y al centro, dominando la composición con su rostro dañado, su expresión neutra y su cabello largo y oscuro.

Es inusual que cualquier indicación o imagen sea tan consistente, que obsesione a otras indicaciones como lo hace ella. Swanson especuló sobre por qué podría ser esto.

“Supongo que porque ella está muy lejos de muchos conceptos, por lo que es difícil salir de su pequeña área espeluznante en el espacio latente. La cuestión cultural, de por qué los datos colocan a esta mujer en el borde del espacio latente, cerca de imágenes de terror sangrientas, es otra cosa en la que pensar”, dijo.

Aunque es una simplificación excesiva, el espacio latente realmente parece un mapa, y las indicaciones como instrucciones para navegar por él, y el sistema dibuja lo que sea que termine en el lugar donde se le pide que vaya, ya sea un terreno muy transitado como “naturaleza muerta de un maestro holandés”. ” o una síntesis de conceptos oscuros o inconexos: “robots luchan contra extraterrestres en un grabado cubista de Dore”. Como puedes ver:

Créditos de imagen: TechCrunch / DALL-E

Una explicación puramente especulativa de por qué existe Loab tiene que ver con cómo se presenta ese mapa. Como sugirió Swanson, es probable que, simplemente por el hecho de que los logotipos de las empresas y las imágenes horribles y aterradoras estén muy lejos uno del otro conceptualmente.

Un indicador negativo no significa “tomar diez pasos de datos en la otra dirección”, significa seguir avanzando lo más lejos que pueda, y es más que posible que las imágenes en los confines más lejanos del espacio latente de una IA sean más extremas o poco comunes. valores. ¿No lo organizaría de esa manera, con cosas que tienen muchos puntos en común o referencias cruzadas en el “centro”, sin importar cómo lo defina, y cosas extrañas y salvajes que rara vez son relevantes en el “borde”?

Por lo tanto, las indicaciones negativas pueden actuar como una forma de explorar la frontera del mapa mental de la IA, examinando los conceptos que considera demasiado extravagantes para almacenar entre conceptos prosaicos como caras felices, hermosos paisajes o mascotas juguetonas.

El bosque oscuro del subconsciente de la IA

El hecho desconcertante es que nadie entiende realmente cómo se estructuran los espacios latentes o por qué. Por supuesto, hay una gran cantidad de investigación sobre el tema y algunos indicios de que están organizados de alguna manera, como nuestras propias mentes, lo cual tiene sentido, ya que fueron construidos más o menos a imitación de ellos. Pero en otras formas tienen estructuras totalmente únicas que se conectan a través de grandes distancias conceptuales.

Para ser claros, no es como si hubiera un puñado de imágenes específicamente de Loab esperando ser encontradas; definitivamente se están creando sobre la marcha, y Swanson me dijo que no hay indicios de que el críptido digital se base en ningún artista u obra en particular. . ¡Por eso el espacio latente es latente! Estas imágenes surgieron de una combinación de conceptos extraños y terribles que ocupan la misma área en la memoria del modelo, al igual que en el diagrama anterior, los idiomas se agruparon en función de su similitud.

¿De qué rincón oscuro o asociaciones inconscientes brotó Loab, completamente formado y coherente? Todavía no podemos rastrear el camino que tomó el modelo para llegar a su ubicación; el espacio latente de un modelo entrenado es vasto e impenetrablemente complejo.

La única forma en que podemos volver a llegar al lugar es a través de las palabras mágicas, pronunciadas mientras retrocedemos por ese espacio con los ojos cerrados, hasta llegar a la cabaña de la bruja a la que no se puede acceder por medios ordinarios. Loab no es un fantasma, pero es una anomalía, pero, paradójicamente, puede ser una de una cantidad efectivamente infinita de anomalías que esperan ser convocadas desde los confines más lejanos y oscuros del espacio latente de cualquier modelo de IA.

Puede que no sea sobrenatural… pero seguro que no es natural.

Source link