En el imaginario popular, las inteligencias artificiales (IA) iban a ser artefactos desapasionados, movidos solo por la razón, incapaces de intuir, bromear, equivocarse o ser creativas. Pero la realidad ha resultado ser diferente: a los últimos algoritmos IA se les da bastante bien hacer todo eso.
Estos días he experimentado con varios modelos de IA, redes neuronales masivas entrenadas para escribir, programar o pintar. Son algoritmos punteros, pero he podido interactuar con ellos desde casa, sin ser ningún experto y dedicándole un rato. Os cuento sobre cuatro ejemplos, la punta del iceberg de una revolución en marcha.
Una IA que pinta
Empecé haciendo un dibujo con Geniverse, una IA pensada para “aumentar tu creatividad”. Aunque está en fase de pruebas, es absurdamente fácil de usar: escribes las órdenes de lo que quieres que dibuje —el prompt—, haces clic y su algoritmo iterativo convierte un ruido blanco inicial en una imagen única que refleja lo que pediste.
Este fue el proceso de dibujo cuando le pedí «Un chico mirando un paisaje brillante. Las manos del chico están ardiendo. Estilo artstation [una web de ilustraciones]».
Video del proceso de creación de una pintura con la IA de Geniverse.
El algoritmo empieza con una imagen que es solo ruido, va explorando cambios iterativamente, en la dirección que le acerca a reflejar la frase que le hemos pedido. En este caso la frase era: «Chico mirando un paisaje brillante. Las manos del chico están ardiendo. Estilo artstation».
en una imagen única que refleje lo que pediste.
Con las mismas instrucciones le pedí hacer más dibujos, que son diferentes cada vez, aunque repiten patrones. Aquí van son cuatro ejemplos:
Cuatro imágenes pequeñas creadas por la Inteligencia Artificial de Geniverse, a partir del texto: «Chico mirando un paisaje brillante. Las manos del chico están ardiendo. Estilo artstation».
También puedes pedirle a Geniverse que refine un dibujo. Aquí tomé la primera de las imágenes anteriores, le dije que «el chico tiene el pelo marrón», que usase «colores brillantes», y que añadiese detalles. El resultado fue esta ilustración de abajo, que es mejor que cualquier cosa que yo pudiese pintar.
Una imagen detallada creada por la Inteligencia Artificial de Geniverse, a partir del texto: «Chico mirando un paisaje brillante. Las manos del chico están ardiendo. Estilo artstation. El chico tiene el pelo marrón».
Javier Ideami, una de las personas detrás de Geniverse, me explicó que su plan es hacer herramientas de Inteligencia Artificial que ayuden a la gente a dar vida a sus ideas. Lo conciben como un trabajo en equipo, entre persona y máquina, porque tú tienes que elegir los comandos, tocar parámetros, etcétera. Las IA actuales son como adolescentes geniales, capaces pero volubles, e Ideami cree que un empleo del futuro será dialogar con ellas: “habrá personas dedicadas a la ingeniería de prompt, expertas en saber entenderse con una IA, que conocen su entrenamiento y que casi empatizan con ella”.
Después del dibujo del chico, según pidiéndo otras imágenes, como esta de «una chica que mira un paisaje. La chica tiene el pelo azul. Es una obra abstracta de Kandinsky con colores brillantes».
Una imagen creada por la Inteligencia Artificial de Geniverse, a partir del texto: ««Una chica que mira un paisaje. La chica tiene el pelo azul. Es una obra abstracta de Kandinsky. Colores brillantes».
También le quedó bonita esta de de un «paisaje de un valle cruzado por un río, con una manada de búfalos en el fondo. En acuarelas. Con colores brillantes en el cielo».
Una imagen creada por la Inteligencia Artificial de Geniverse, a partir del texto: «Paisaje de un valle cruzado por un río, con una manada de búfalos en el fondo. En acuarelas. Con colores brillantes en el cielo».Otras IAs que inventan objetos
Para mi siguiente prueba usé un modelo de generación de imágenes recién publicado, del grupo CompVis de la Universidad de Heidelberg, que también es capaz de crear imágenes a partir de texto. Le pedí «Una escena japonesa, una pintura por Edward Hopper», y el resultado fueron estos cuadros casi listos para colgar en la pared:
Una imagen creada por la Inteligencia Artificial LDM de CompVis, a partir del texto: «Una escena japonesa, una pintura por Edward Hopper».
Cuando le dije de hacer cosas más complicadas, salió del paso. Aquí van unas «paella pintada por Edward Hopper».
Una imagen creada por la Inteligencia Artificial LDM de CompVis, a partir del texto: «Una paella pintada por Edward Hopper».
¿No es alucinante? Algunas veces se equivoca, y hay cosas que era incapaz de hacer, pero puede crear cosas rarísimas, como estas «sillas con forma de kiwi».
Una imagen creada por la Inteligencia Artificial LDM de CompVis, a partir del texto: ««Sillas con forma de kiwi»».
Continuamente salen nuevos modelos de IA generativa, como DALL·E 2, que se publicó esta semana y que tiene capacidades similares, quizás más potentes. No he podido probarlo todavía, pero sus creadores han compartido algunas imágenes, como esta de «un niño y un perro mirando las estrellas».
Una imagen creada por la Inteligencia Artificial DALL·E 2, a partir del texto: «Un niño y un perro mirando las estrellas».
Ninguna de estas imágenes existía antes. Es importante darse cuenta de que estas IAs no están haciendo copias de cosas que han visto. Las han entrenado mirado cientos de miles de imágenes y de frases, sí, pero a partir de eso han “aprendido” patrones y estructuras, en un proceso iterativo de retropropagación que se conoce bien desde los ochenta, pero cuyo potencial ha explotado en la última década. Estas redes pueden hacer paellas, y valles, y búfalos, y sillas y Kiwis; y cuando se les pide conectar dos de esos conceptos, de algún modo, son capaces de unirlos sin perder las características salientes de cada uno. Es una forma evidente de creatividad.
Otra IA escribe historias
Para el tercer ejemplo usé GPT-3, de OpenAI, un modelo de lenguaje entrenado para producir texto parecido al humano. En esencia, ha estudiado todo el texto de internet para aprender a escribir. No es como un loro que repite, sino que es capaz de cosas sorprendentes: puede resumir un texto, corregir gramática o traducir, pero también le puedes pedir que diga qué ciudades se mencionan o que explique una broma.
Para este ejemplo, le dije esto: «Escribe una historia de cuatro frases sobre un niño y una niña que se encuentran después de 30 años». Y me devolvió esto:
Érase una vez un niño, que conoció a una niña.Se hicieron amigos.Estaban muy contentos juntos.Fueron separados cuando tenían once años.Se volvieron a encontrar cuando tenían cuarenta y un años.
Luego le pedí que añadiese un final feliz, y añadió uno trillado: Estaban tan contentos de verse. Decidieron casarse. Le dije que cambiase los protagonistas «para que no fuesen humanos, sino otros seres», y los cambió por un unicornio y un dragón. ¿Cómo sabe quienes son los protagonistas de un párrafo inédito? Entiende el significado de ese concepto y es capaz de encontrarlo en el texto.
Seguí dándole instrucciones (algunas dos veces, porque fallaba), «quita la boda y que en su lugar viajen mucho», «cambia la historia para tener un dialogo al comienzo», «cambia la historia para que sea un solo párrafo», «quita la frase sobre ser feliz» y «haz concretos los lugares donde a donde viajan». Lo hizo todo:
Érase una vez un unicornio que se encontró con un dragón. El dragón dijo: “Hola, unicornio. Soy un dragón. ¿Cómo te llamas?” El unicornio dijo: “Me llamo unicornio”. Se hicieron amigos. Fueron separados cuando tenían once años. Se volvieron a encontrar cuando tenían cuarenta y un años. Estaban tan contentos de verse. Decidieron viajar a muchos lugares. Fueron a la luna, al sol y a las estrellas.
El cuento no es gran cosa, pero lo relevante de este caso es que GPT-3 entiende instrucciones complejas.
Otra variante de GPT-3 puede convertir inglés en código informático. Programa. Puedes decirle «haz una función en Javascript que calcule los días que han pasado entre dos fechas». El producto se llama Copilot, y de nuevo se supone que es un tándem, “tu pareja IA para programar”. El ingeniero de software Juan Font, de la Agencia Espacial Europea, me contó cómo lo usa: “es útil para trozos de código repetitivos, boilerplate, que antes tenías que buscar cada vez”. También me dijo que funciona mejor de lo que hubiese pensado posible. No es solo que la IA de Copilot haya entrenado con todo el código abierto que existe en internet, es que además mira y entiende el código contextual, el proyecto que acabas de programar tú, para saber qué estás haciendo, como se llaman tus variables o qué estilo usas.
¿Y en el futuro qué?
De mi semana de exploración he sacado tres conclusiones. La primera es que estás IA generativas van a estar al alcance de mucha gente. Son modelos caros (en euros, cómputo y kilovatios), pero se ejecutan en la nube. Además, no he tenido que programar, ni descargar aplicaciones, ni usar un ordenador potente. Basta el navegador para enviarles órdenes, esperar un poco, y que la red neuronal te devuelve su dibujo.
La segunda es que los avances en Inteligencia Artificial van rapidísimo. Quizás se den con un muro, pero de momento aceleran: ninguna de las IA que usado tiene tres años; y lo que me permiten hacer era imposible entonces. Dejo para otro día un asunto que flota en el ambiente, que es pensar en sus aplicaciones, las virtuosas y las inquietantes.
La otra incógnita es saber de qué serán capaces en diez años.
No tengo ni idea, pero estoy bastante seguro de que no les faltará creatividad. Al contrario, creo que los dibujos de estos algoritmos primitivos nos obligan a pensar en nuestra creatividad. En el pasado hemos idealizado el proceso humano de creación, que está rodeado de mitos, pero tenemos que enfrentar la posibilidad de que quizás no sea algo ni tan misterioso ni tan único como sentimos.
Acabo dándole el último párrafo a la IA del modelo GPT-3. Le di el borrador del artículo y le pedí una conclusión. Esto es lo que me dice que añada: “No significa que la creatividad humana vaya a desaparecer. Al contrario, se espera que las posibilidades de crear se multipliquen. En el futuro tendremos más herramientas y podremos hacer cosas que antes no podíamos. Es como el descubrimiento del pincel: no borró las pinturas rupestres, sino que permitió que fueran mucho más refinadas”.
Puedes seguir a EL PAÍS TECNOLOGÍA en Facebook y Twitter o apuntarte aquí para recibir nuestra newsletter semanal.
Contenido exclusivo para suscriptores
Lee sin límites