La IA generativa está repentinamente en todas partes. Durante el año pasado, probablemente haya visto a personas exhibiendo impresionantes obras de arte generadas por IA, gracias al progreso en los algoritmos de texto a imagen introducidos por grupos como OpenAI y Stability AI. Una proliferación de nuevas empresas ahora está tratando de diseñar aplicaciones para esta nueva clase de modelo de lenguaje, donde la máquina es capaz de crear nuevos textos, imágenes y videos basados en una simple entrada humana.
Uno de ellos es Película, una startup de dos años que aprovecha la IA generativa junto con otros marcos de aprendizaje automático como GAN para hacer videos con avatares humanos parlantes. La plataforma persigue a los especialistas en marketing con una interfaz de arrastrar y soltar estilo Canva. Los usuarios primero elegirán entre una variedad de plantillas, ya sea un tema para un sitio de compras o un viaje a Japón. Luego, pueden agregar un avatar hiperrealista para que sea el “portavoz” del video, con un discurso generado por la entrada de texto. El atuendo, la cara y la voz del humano creado por IA se pueden intercambiar con un clic.
La base de usuarios de Movio se encuentra actualmente en los cientos de miles más bajos, con clientes que pagan cerca de 1,000. Hasta ahora, ha recaudado alrededor de $ 9 millones en fondos de inversionistas que incluyen a IDG, Sequoia Capital China y, más recientemente, Baidu Ventures. Xu conoció a su cofundador y director financiero, Liang Wang, un veterano de ByteDance y de la red social de música Smule, cuando ambos estudiaban en la Universidad Carnegie Mellon.
El año pasado, cubrimos cómo Movio, que entonces se llamaba Surreal, obtuvo un caso de uso brillante para deepfake. En ese momento, la empresa tenía su sede en Shenzhen, el paraíso del hardware también conocido por su vibrante industria de comercio electrónico impulsada por la exportación: la mayoría de los vendedores de Amazon son de la metrópolis. Los comerciantes usaban Movio para crear videos promocionales narrados por humanos sintetizados, eliminando la necesidad de contratar modelos reales.
Movio se mudó recientemente a Los Ángeles, donde su cofundador y director ejecutivo jose xu anteriormente trabajó durante seis años como ingeniero de Snap. Esto se debe a que la startup espera capturar la ola de especialistas en marketing que se están calentando con las herramientas de inteligencia artificial para ayudarlos en su trabajo.
“Estamos haciendo lo que hacen Jasper y Copy.ai, pero para la producción de video”, dijo Xu a TechCrunch, refiriéndose a dos de los mejores ayudantes de contenido de IA de la actualidad. “Los videos son poderosos: solo imagine si los especialistas en marketing pueden enviar correos electrónicos con avatares humanos parlantes en lugar de texto sin formato”.
Movio solo puede sintetizar cabezas parlantes por ahora, pero está trabajando hacia un futuro en el que sus algoritmos puedan generar movimiento de todo el cuerpo, lo que permitirá a la compañía acercarse a su objetivo de ser una “plataforma de producción de video de IA todo en uno”. ”
La startup cobra a los usuarios por la duración de los videos, que se correlaciona con el guión que envían, así como una tarifa premium para aquellos que usan caras personalizadas, una función que es particularmente popular para la “capacitación corporativa”, según Xu. Movio también ha abierto su API a sitios web de terceros, algunos de los cuales están utilizando su motor para crear avatares emergentes de atención al cliente.
“El video generado por IA es solo un pequeño segmento dentro del AIGC [AI generated content] industria. Hemos visto cuánto puede hacer la conversión de texto a imagen, y espero que la conversión de texto a video genere una interrupción aún mayor cuando esté lista”, dijo Xu.
Source link