QuickVid usa IA para generar videos de formato corto, completos con voces en off

Neto

hace 3 años

QuickVid usa IA para generar videos de formato corto, completos con voces en off

La IA generativa está llegando para videos. Un nuevo sitio web, QuickVid, combina varios sistemas generativos de inteligencia artificial en una sola herramienta para crear automáticamente videos cortos de YouTube, Instagram TikTok y Snapchat. Con tan solo una palabra, QuickVid elige un video de fondo de una biblioteca, escribe un guión y palabras clave, superpone imágenes generadas por DALL-E 2 y agrega una voz en off sintética y música de fondo de la biblioteca de música libre de regalías de YouTube.

El creador de QuickVid, Daniel Habib, dice que está creando el servicio para ayudar a los creadores a satisfacer la demanda “cada vez mayor” de sus seguidores.

“Al proporcionar a los creadores herramientas para producir contenido de calidad de forma rápida y sencilla, QuickVid ayuda a los creadores a aumentar su producción de contenido, reduciendo el riesgo de agotamiento”, dijo Habib a TechCrunch en una entrevista por correo electrónico. “Nuestro objetivo es empoderar a su creador favorito para mantenerse al día con las demandas de su audiencia aprovechando los avances en IA”.

Pero dependiendo de cómo se usen, las herramientas como QuickVid amenazan con inundar los canales ya llenos de spam y contenido duplicado. También se enfrentan a una posible reacción negativa de los creadores que optan por no usar las herramientas, ya sea por el costo ($10 por mes) o por principio, pero podrían tener que competir con una gran cantidad de nuevos videos generados por IA.

ir tras el vídeo

QuickVid, que Habib, un desarrollador autodidacta que trabajó anteriormente en Meta en Facebook Live y la infraestructura de video, construyó en cuestión de semanas, lanzó el 27 de diciembre. Actualmente es relativamente básico: Habib dice que llegarán más opciones de personalización. Enero, pero QuickVid puede improvisar los componentes que componen un video informativo típico de YouTube Short o TikTok, incluidos subtítulos e incluso avatares.

Es fácil de usar. Primero, un usuario ingresa un mensaje que describe el tema del video que desea crear. QuickVid usa el mensaje para generar un script, aprovechando los poderes de texto generativo de GPT-3. De las palabras clave extraídas del guión automáticamente o ingresadas manualmente, QuickVid selecciona un video de fondo de la biblioteca de medios de stock libre de regalías Pexels y genera imágenes superpuestas usando DALL-E 2. Luego emite una voz en off a través de la API de texto a voz de Google Cloud. — Habib dice que los usuarios pronto podrán clonar su voz, antes de combinar todos estos elementos en un video.

Créditos de imagen: QuickVid

Vea este video hecho con el mensaje “Cats”:

O este:

QuickVid ciertamente no está empujando los límites de lo que es posible con la IA generativa. Tanto Meta como Google han presentado sistemas de inteligencia artificial que pueden generar clips completamente originales con un mensaje de texto. Pero QuickVid amalgama la IA existente para explotar el formato repetitivo y con plantillas de videos de formato corto pesados de b-roll, solucionando el problema de tener que generar el metraje por sí mismo.

“Los creadores exitosos tienen una barra de calidad extremadamente alta y no están interesados en publicar contenido que no sienten que está en su propia voz”, dijo Habib. “Este es el caso de uso en el que estamos enfocados”.

Supuestamente siendo ese el caso, en términos de calidad, los videos de QuickVid son generalmente una bolsa mixta. Los videos de fondo tienden a ser un poco aleatorios o solo están relacionados tangencialmente con el tema, lo cual no es sorprendente dado que QuickVid actualmente se limita al catálogo de Pexels. Mientras tanto, las imágenes generadas por DALL-E 2 exhiben las limitaciones de la tecnología actual de texto a imagen, como texto distorsionado y proporciones desproporcionadas.

En respuesta a mis comentarios, Habib dijo que QuickVid “se está probando y manipulando a diario”.

Los derechos de autor

Según Habib, los usuarios de QuickVid conservan el derecho de usar comercialmente el contenido que crean y tienen permiso para monetizarlo en plataformas como YouTube. Pero el estado de los derechos de autor en torno al contenido generado por IA es… nebuloso, al menos en la actualidad. La Oficina de Patentes y Marcas de los Estados Unidos (USPTO) recientemente movido para revocar la protección de derechos de autor para un cómic generado por IA, por ejemplo, diciendo que las obras sujetas a derechos de autor requieren autoría humana.

Cuando se le preguntó cómo la decisión de la USPTO podría afectar a QuickVid, Habib dijo que cree que solo se refiere a la “patentabilidad” de los productos generados por IA y no a los derechos de los creadores para usar y monetizar su contenido. Los creadores, señaló, no suelen presentar patentes para videos y, por lo general, se inclinan por la economía del creador, lo que permite que otros creadores reutilicen sus clips para aumentar su propio alcance.

“Los creadores se preocupan por publicar contenido de alta calidad en su voz que ayudará a hacer crecer su canal”, dijo Habib.

Otro desafío legal en el horizonte podría afectar la integración DALL-E 2 de QuickVid y, por extensión, la capacidad del sitio para generar superposiciones de imágenes. Microsoft, GitHub y OpenAI están siendo demandado en una demanda colectiva que los acusa de violar la ley de derechos de autor al permitir que Copilot, un sistema de generación de código, regurgite secciones de código con licencia sin proporcionar crédito. (Copilot fue desarrollado conjuntamente por OpenAI y GitHub, propiedad de Microsoft). El caso tiene implicaciones para la IA de arte generativo como DALL-E 2, que de manera similar copia y pega de los conjuntos de datos en los que fueron entrenados (es decir, imágenes).

Habib no está preocupado, argumentando que el genio de la IA generativa está fuera de la botella. “Si apareciera otra demanda y OpenAI desapareciera mañana, hay varias alternativas que podrían impulsar a QuickVid”, dijo, refiriéndose al sistema Stable Diffusion de código abierto similar a DALL-E 2. QuickVid ya está probando Stable Diffusion para generar imágenes de avatar.

Moderación y spam

Aparte de los dilemas legales, QuickVid pronto podría tener un problema de moderación en sus manos. Si bien OpenAI ha implementado filtros y técnicas para prevenirlos, la IA generativa tiene problemas de toxicidad y precisión fáctica bien conocidos. Caños GPT-3 desinformación, particularmente sobre eventos recientes, que están más allá de los límites de su base de conocimiento. Y ChatGPT, una descendencia perfeccionada de GPT-3, ha sido mostrado utilizar un lenguaje sexista y racista.

Eso es especialmente preocupante para las personas que usarían QuickVid para crear videos informativos. En una prueba rápida, le pedí a mi compañero, que es mucho más creativo que yo, particularmente en esta área, que ingresara algunas indicaciones ofensivas para ver qué generaría QuickVid. Para crédito de QuickVid, obviamente, las indicaciones problemáticas como “nuevo orden mundial judío” y “teoría de la conspiración del 11 de septiembre” no produjeron guiones tóxicos. Pero para “La teoría crítica de la raza adoctrinando a los estudiantes”, QuickVid generó un video que implica que la teoría crítica de la raza podría usarse para lavar el cerebro a los escolares.

Ver:

Habib dice que confía en los filtros de OpenAI para realizar la mayor parte del trabajo de moderación y afirma que corresponde a los usuarios revisar manualmente cada video creado por QuickVid para garantizar que “todo esté dentro de los límites de la ley”.

“Como regla general, creo que las personas deberían poder expresarse y crear el contenido que quieran”, dijo Habib.

Eso aparentemente incluye contenido de spam. Habib argumenta que los algoritmos de las plataformas de video, no QuickVid, están mejor posicionados para determinar la calidad de un video, y que las personas que producen contenido de baja calidad “solo están dañando su propia reputación”. El daño a la reputación naturalmente desincentivará a las personas a crear campañas masivas de spam con QuickVid, dice.

“Si la gente no quiere ver tu video, entonces no recibirás distribución en plataformas como YouTube”, agregó. “Producir contenido de baja calidad también hará que las personas vean tu canal de forma negativa”.

Pero es instructivo observar agencias de publicidad como Fractl, que en 2019 usó un sistema de inteligencia artificial llamado Grover para generar un sitio completo de materiales de marketing: al diablo con la reputación. en un entrevista con The Verge, la socia de Fractl, Kristin Tynski, dijo que preveía que la IA generativa permitiría “un tsunami masivo de contenido generado por computadora en todos los nichos imaginables”.

En cualquier caso, las plataformas para compartir videos como TikTok y YouTube no han tenido que lidiar con la moderación de contenido generado por IA a gran escala. Deepfakes, videos sintéticos que reemplazan a una persona existente con la imagen de otra persona, comenzaron a poblar plataformas como YouTube hace varios años, impulsados por herramientas que facilitaron la producción de videos falsos. Pero a diferencia de los deepfakes más convincentes de la actualidad, los tipos de videos que crea QuickVid obviamente no son generados por IA de ninguna manera.

La política de la Búsqueda de Google sobre el texto generado por IA podría ser una vista previa de lo que vendrá en el dominio del video. Google no trata el texto sintético de manera diferente al texto escrito por humanos en lo que respecta a las clasificaciones de búsqueda, pero toma acciones en contenido que “tiene la intención de manipular las clasificaciones de búsqueda y no ayudar a los usuarios”. Eso incluye contenido unido o combinado de diferentes páginas web que “[doesn’t] agregar valor suficiente”, así como el contenido generado a través de procesos puramente automatizados, los cuales podrían aplicarse a QuickVid.

En otras palabras, es posible que los videos generados por IA no se prohíban directamente de las plataformas en caso de que despeguen de manera importante, sino que simplemente se conviertan en el costo de hacer negocios. No es probable que eso alivie los temores de los expertos que creen que las plataformas como TikTok se están convirtiendo en un nuevo hogar para engañoso videos, pero, como dijo Habib durante la entrevista, “no hay forma de detener la revolución de la IA generativa”.

Source link