Cómo China está construyendo un universo de IA generativo paralelo

Cómo China está construyendo un universo de IA generativo paralelo

El gigantesco salto tecnológico que los modelos de aprendizaje automático han mostrado en los últimos meses está entusiasmando a todos con el futuro de la IA, pero también nerviosos por sus incómodas consecuencias. Después de que las herramientas de texto a imagen de Stability AI y OpenAI se convirtieran en la comidilla de la ciudad, la capacidad de ChatGPT para mantener conversaciones inteligentes es la nueva obsesión en todos los sectores.

En China, donde la comunidad tecnológica siempre ha observado de cerca el progreso en Occidente, los empresarios, investigadores e inversores están buscando formas de hacer mella en el espacio de la IA generativa. Las firmas tecnológicas están diseñando herramientas basadas en modelos de código abierto para atraer a consumidores y clientes empresariales. Las personas están sacando provecho del contenido generado por IA. Los reguladores han respondido rápidamente para definir cómo se debe utilizar la síntesis de texto, imagen y video. Mientras tanto, las sanciones tecnológicas de EE. UU. están generando preocupaciones sobre la capacidad de China para mantenerse al día con el avance de la IA.

A medida que la IA generativa conquista el mundo a fines de 2022, echemos un vistazo a cómo esta tecnología explosiva se está sacudiendo en China.

sabores chinos

Gracias a las plataformas de creación de arte viral como Stable Diffusion y DALL-E 2, la IA generativa está repentinamente en boca de todos. Al otro lado del mundo, los gigantes tecnológicos chinos también han cautivado al público con sus productos equivalentes, agregando un giro para adaptarse a los gustos y el clima político del país.

Baidu, que se hizo un nombre en los motores de búsqueda y en los últimos años ha estado intensificando su juego en la conducción autónoma, opera ERNIE-ViLGa modelo de 10 mil millones de parámetros entrenado en un conjunto de datos de 145 millones de pares de imagen y texto en chino. ¿Cómo se compara con su contraparte estadounidense? A continuación, se muestran los resultados del mensaje “niños comiendo shumai en el barrio chino de Nueva York” dado a Stable Diffusion, en comparación con el mismo mensaje en chino (纽约唐人街小孩吃烧卖) para ERNIE-ViLG.

Difusión estable

ERNIE-ViLG

Como alguien que creció comiendo dim sum en China y en los barrios chinos, diría que los resultados son un empate. Ninguno obtuvo el shumai correcto, que, en el contexto del dim sum, es un tipo de suculenta bola de masa hervida de gambas y cerdo en un envoltorio amarillo entreabierto. Mientras Stable Diffusion clava la atmósfera de un restaurante de dim sum de Chinatown, su shumai está apagado (pero veo a dónde va la máquina). Y aunque ERNIE-ViLG genera un tipo de shumai, es una variedad más común en el este de China que la versión cantonesa.

La prueba rápida refleja la dificultad de capturar los matices culturales cuando los conjuntos de datos utilizados están inherentemente sesgados, asumiendo que Stable Diffusion tendría más datos sobre la diáspora china y ERNIE-ViLG probablemente esté entrenado en una mayor variedad de imágenes shumai que son más raras fuera de China.

Otra herramienta china que ha hecho ruido es la de Tencent Dimensión diferente yo, que puede convertir fotos de personas en personajes de anime. El generador de IA exhibe su propio sesgo. Destinado a usuarios chinos, despegó inesperadamente en otras regiones amantes del anime como América del Sur. Pero los usuarios pronto se dieron cuenta de que la plataforma no identificaba a las personas de raza negra y de talla grande, grupos que faltan notablemente en el anime japonés, lo que genera resultados ofensivos generados por IA.

Por supuesto, también claramente no tener el modelo ajustado correctamente para personas de piel más oscura, suspiro

De todos modos, Different Dimension Me es el nombre, pero lo siento, ya bloquearon / limitaron a los usuarios en el extranjero porque no pudieron manejar el tráfico. pic.twitter.com/cYi6rJwTaC

— Rui Ma 马睿 (@ruima) 7 de diciembre de 2022

Aparte de ERNIE-ViLG, otro modelo chino de texto a imagen a gran escala es Taiyi, una creación de IDEA, un laboratorio de investigación dirigido por el renombrado científico informático Harry Shum, quien cofundó la rama de investigación más grande de Microsoft fuera de los EE. UU., Microsoft Research Asia. El modelo de IA de código abierto se entrena en 20 millones de pares de imagen-texto chinos filtrados y tiene mil millones parámetros.

A diferencia de Baidu y otras empresas tecnológicas con fines de lucro, IDEA es una de las pocas instituciones respaldadas por los gobiernos locales en los últimos años para trabajar en tecnologías de punta. Eso significa que el centro probablemente disfruta de más libertad de investigación sin la presión de impulsar el éxito comercial. Con sede en el centro tecnológico de Shenzhen y respaldado por una de las ciudades más ricas de China, es un equipo prometedor que vale la pena ver.

Reglas de la IA

Las herramientas de IA generativa de China no solo se caracterizan por los datos domésticos de los que aprenden; también están determinados por las leyes locales. Como MIT Technology Review señaló, el modelo de texto a imagen de Baidu filtra las palabras clave políticamente sensibles. Eso es de esperar, dado que la censura ha sido durante mucho tiempo una práctica universal en Internet en China.

Lo que es más significativo para el futuro del campo incipiente es el nuevo conjunto de medidas regulatorias que apuntan a lo que el gobierno denomina “tecnología de síntesis profunda”, que denota “tecnología que usa aprendizaje profundo, realidad virtual y otros algoritmos de síntesis para generar texto, imágenes, audio, video y escenas virtuales”. Al igual que con otros tipos de servicios de Internet en China, desde juegos hasta redes sociales, se les pide a los usuarios que verifiquen sus nombres antes de usar aplicaciones generativas de IA. El hecho de que las indicaciones se puedan rastrear hasta la identidad real de uno inevitablemente tiene un impacto restrictivo en el comportamiento del usuario.

Pero en el lado positivo, estas reglas podrían conducir a un uso más responsable de la IA generativa, de la que ya se está abusando en otros lugares para producir contenido NSFW y sexista. La regulación china, por ejemplo, prohíbe explícitamente que las personas generen y difundan noticias falsas creadas por IA. Sin embargo, la forma en que se implementará depende de los proveedores de servicios.

“Es interesante que China esté a la vanguardia en el intento de regular [generative AI] como país”, dijo Yoav Shoham, fundador de AI21 Labs, un rival de OpenAI con sede en Israel, en una entrevista. “Hay varias empresas que están poniendo límites a la IA… Todos los países que conozco tienen esfuerzos para regular la IA o para asegurarse de alguna manera de que el sistema legal, o el sistema social, se mantenga al día con la tecnología, específicamente sobre la regulación de la generación automática. de contenido.”

Pero todavía no hay consenso sobre cómo se debe gobernar este campo que cambia rápidamente. “Creo que es un área que todos estamos aprendiendo juntos”, admitió Shoham. “Tiene que ser un esfuerzo de colaboración. Tiene que involucrar a tecnólogos que realmente entiendan la tecnología y lo que hace y lo que no hace, el sector público, los científicos sociales y las personas que se ven afectadas por la tecnología, así como el gobierno, incluido el tipo de comercio y legal. aspecto del reglamento”.

Monetizando la IA

A medida que los artistas se preocupan por ser reemplazados por una poderosa IA, muchos en China están aprovechando los algoritmos de aprendizaje automático para ganar dinero de muchas maneras. No son de la multitud más conocedora de la tecnología. Más bien, son oportunistas o amas de casa que buscan una fuente adicional de ingresos. Se dan cuenta de que al mejorar sus indicaciones, pueden engañar a la IA para que haga emojis creativos o fondos de pantalla impresionantes, que pueden publicar en las redes sociales para generar ingresos publicitarios o cobrar directamente por las descargas. Los realmente habilidosos también venden sus indicaciones a otros que quieren unirse al juego de hacer dinero, o incluso entrenarlos por una tarifa.

Otros en China están usando IA en sus trabajos formales como El resto del mundo. Los escritores de ficción ligera, por ejemplo, pueden producir ilustraciones para sus obras a bajo costo, un género que es más corto que las novelas y que a menudo presenta ilustraciones. Un caso de uso intrigante que potencialmente puede alterar los ámbitos de la fabricación es el uso de IA para diseñar camisetas, clavos a presión e impresiones para otros bienes de consumo. Al generar rápidamente grandes lotes de prototipos, los fabricantes ahorran en costos de diseño y acortan su ciclo de producción.

Es demasiado pronto para saber cuán diferente se está desarrollando la IA generativa en China y Occidente. Pero los empresarios han tomado decisiones basadas en su observación temprana. Algunos fundadores me dijeron que las empresas y los profesionales generalmente están felices de pagar por la IA porque ven un retorno directo de la inversión, por lo que las nuevas empresas están ansiosas por forjar casos de uso de la industria. Una aplicación inteligente provino de Surreal respaldado por Sequoia China (luego rebautizado como Movio) y ZMO.ai respaldado por Hillhouse, que descubrió durante la pandemia que los vendedores de comercio electrónico estaban luchando por encontrar modelos extranjeros mientras China mantenía sus fronteras cerradas. ¿La solución? Las dos empresas trabajaron en algoritmos que generaron modelos de moda de todas las formas, colores y razas.

Pero algunos empresarios no creen que su SaaS impulsado por IA experimente el tipo de valoración vertiginosa y el crecimiento meteórico que disfrutan sus contrapartes occidentales, como Jasper y Stability AI. A lo largo de los años, numerosas nuevas empresas chinas me han dicho que tienen la misma preocupación: los clientes empresariales de China generalmente están menos dispuestos a pagar por SaaS que los de las economías desarrolladas, razón por la cual muchos de ellos comienzan a expandirse en el extranjero.

La competencia en el espacio SaaS de China también es constante. “En EE. UU., se puede hacer bastante bien creando software basado en productos, que no dependa de los servicios humanos para adquirir o retener usuarios. Pero en China, incluso si tiene un gran producto, su rival podría robar su código fuente de la noche a la mañana y contratar a docenas de personal de atención al cliente, que no cuesta tanto, para superarlo”, dijo el fundador de una empresa china de inteligencia artificial generativa. , solicitando el anonimato.

Shi Yi, fundador y director general de puesta en marcha de inteligencia de ventas FlashCloud, estuvo de acuerdo en que las empresas chinas a menudo dan prioridad a los rendimientos a corto plazo sobre la innovación a largo plazo. “En lo que respecta al desarrollo de talentos, las empresas tecnológicas chinas tienden a centrarse más en adquirir habilidades en las aplicaciones y generar dinero rápido”, dijo. Un inversionista con sede en Shanghái, que se negó a ser identificado, dijo que estaba “un poco decepcionado de que los grandes avances en IA generativa de este año estén ocurriendo fuera de China”.

Obstáculos por delante

Incluso cuando las empresas tecnológicas chinas quieren invertir en la formación de grandes redes neuronales, es posible que no dispongan de las mejores herramientas. En septiembre, el gobierno de EE. UU. abofeteó a China con controles de exportación de chips de inteligencia artificial de alta gama. Si bien muchas nuevas empresas chinas de inteligencia artificial se centran en el frente de las aplicaciones y no necesitan semiconductores de alto rendimiento que manejen mares de datos, para aquellos que realizan investigaciones básicas, el uso de chips menos potentes significa que la computación llevará más tiempo y costará más, dijo un inversor de software empresarial. en una de las principales firmas chinas de capital de riesgo, solicitando el anonimato. La buena noticia es, argumentó, que tales sanciones están empujando a China a invertir en tecnologías avanzadas a largo plazo.

Como empresa que se anuncia a sí misma como líder en el campo de la IA de China, Baidu cree que el impacto de la sanción de chips de EE. UU. en su negocio de IA es “limitado” tanto a corto como a largo plazo, dijo el vicepresidente ejecutivo de la empresa y jefe de AI Cloud Group. , Dou Shen, en su Llamada de ganancias del tercer trimestre. Eso se debe a que “una gran parte” del negocio de la nube de IA de Baidu “no depende demasiado de los chips altamente avanzados”. Y en los casos en que necesita chips de gama alta, “ya tiene suficientes existencias disponibles, en realidad, para respaldar nuestro negocio a corto plazo”.

¿Qué pasa con el futuro? “Cuando lo miramos a mediano y largo plazo, en realidad tenemos nuestro propio chip de IA desarrollado, llamado así. Kunlun”, dijo el ejecutivo con confianza. “Usando nuestros chips Kunlun [Inaudible] en modelos de idiomas grandes, la eficiencia para realizar tareas de reconocimiento de texto e imágenes en nuestra plataforma de IA se mejoró en un 40 % y el costo total se redujo entre un 20 % y un 30 %”.

El tiempo dirá si Kunlun y otros chips autóctonos de IA le darán a China una ventaja en la carrera de IA generativa.




Source link