El Descript de Andrew Mason se lleva $ 15 millones, adquiere Lyrebird para permitir a los usuarios escribir texto para crear audio en sus propias voces

El Descript de Andrew Mason se lleva $ 15 millones, adquiere Lyrebird para permitir a los usuarios escribir texto para crear audio en sus propias voces

by

in

El auge de la popularidad de los podcasts ha dado una nueva voz al mundo del contenido de las palabras habladas que en gran medida se había dejado sin vida con el declive de la transmisión de radio. Ahora, en la ola de ese crecimiento, una startup llamada Descript que está creando herramientas para hacer que el arte de crear podcasts, o cualquier otro contenido que implique trabajar con audio, sea un poco más fácil con las herramientas de transcripción y edición de audio, tiene un trío de anuncios de noticias: financiación, una adquisición y el lanzamiento de una nueva herramienta que trae parte de la magia del procesamiento del lenguaje natural y la IA al medio al permitir que las personas creen audio de sus propias voces en función del texto que escriben.

Descript, la última startup del fundador de Groupon, Andrew Mason, creada como un spin-off de su negocio de audioguías Detour (que fue adquirida por Bose el año pasado), anuncia hoy $ 15 millones en fondos, una Serie A para expandir el negocio (incluida la contratación más personas) que proviene de Andreessen Horowitz (también financió la ronda de semillas de la startup en 2017) y Redpoint.

Junto con eso, la compañía adquirió una pequeña startup canadiense, Lyrebird, que tenía, como Descript, También construyó herramientas de edición de audio. Juntos, los dos están lanzando una nueva característica para Descript llamada Overdub: las personas ahora podrán crear "plantillas" de sus voces que a su vez pueden usar para crear audio basado en palabras que escriben, parte de un conjunto de producción más grande eso también permitirá a los usuarios editar múltiples voces en múltiples pistas. El audio puede ser independiente o la pista de audio para un video.

(La transcripción del video funciona de manera un poco diferente: cuando agrega palabras o las elimina, el video realiza saltos para dar cuenta de los cambios en el tiempo).

Overdub es la última incorporación a un producto que permite a los usuarios crear transcripciones instantáneas de texto de audio que luego se pueden cortar y potencialmente aumentar con otro tipo de audio utilizando herramientas de arrastrar y soltar que eliminan la necesidad de que los podcasters aprendan software de ingeniería y edición de sonido. . El énfasis no técnico del producto le ha dado a Descript un seguimiento entre los podcasters y otros que usan software de transcripción como parte de sus paquetes de producción de audio. El producto tiene un precio en formato freemium: sin cargo por hasta cuatro horas de contenido de voz, y $ 10 por mes después de eso.

(ID de galería = "1883020,1883019,1883018,1883017")

En la era de las noticias falsas definitorias y ganadoras de elecciones ayudadas y apoyadas por la tecnología, se te perdonaría preguntarte si Overdub podría no ser una autopista hacia la Ciudad Falsa Profunda, donde podrías usar la tecnología para crear cualquier tipo de " declaraciones "de voces famosas.

Mason me dice que la compañía ha creado una forma de evitar que eso suceda.

La demostración en la página de inicio de la compañía se crea con una voz patentada especial solo con fines ilustrativos, pero para activar realmente la función de edición y aumento de una pieza de su propio audio, los usuarios primero deben grabar una serie de declaraciones que repiten, basado en texto creado sobre la marcha y en tiempo real. Estos clips de audio se utilizan para dar forma a su perfil de voz digital.

Esto significa que no se puede, por ejemplo, transmitir audio de Donald Trump al sistema para crear una versión del presidente diciendo que lamenta muchísimo sugerir que construir muros entre Estados Unidos y México era una buena idea, y que esto de hecho, no volvería a Estados Unidos grande de nuevo. (Demasiado.)

Pero si se suscribe a la idea de que los avances tecnológicos en PNL e IA en general son algo así como una caja de Pandora, el gato ya está fuera de la bolsa, e incluso si Descript no lo permite, es probable que alguien más piratee este tipo de tecnología para fines más nefastos. La respuesta, dice Mason, es seguir hablando de esto y asegurarse de que las personas entiendan los potenciales y las dificultades.

"La gente ya ha creado la capacidad de hacer falsificaciones profundas", dijo Mason. “Debemos esperar que no todos sigan las mismas restricciones que nosotros hemos seguido. Pero parte de nuestro papel es crear conciencia de las posibilidades. Tu voz es tu identidad, y necesitas tener esa voz. Es una cuestión de privacidad, básicamente ".

Los desarrollos subrayan la nueva oportunidad que se ha abierto al aprovechar algunos de los desarrollos en inteligencia artificial para abordar lo que es un mercado en crecimiento. Por un lado, es un gran mercado: basado solo en los ingresos publicitarios, se espera que el podcasting genere unos $ 679 millones este año y $ 1 mil millones para 2021, según el IAB, una razón por la cual compañías como Spotify y Apple están apostando fuerte en él como complemento de sus negocios de transmisión de música.

Por otro lado, el área de herramientas de producción para podcasters es un mercado muy concurrido, con una serie de nuevas empresas y otras que presentan muchas herramientas que funcionan bastante bien para identificar lo que la gente dice y transcribirlo con precisión.

En el frente de la transcripción y el área donde trabaja Descript, los rivales incluyen a Trint, Wreally y Otter, entre muchos otros. Decript en sí mismo ni siquiera crea su software básico de PNL; usa Google, ya que la PNL básica es ahora un área que se ha convertido esencialmente en un "producto básico", dijo Mason en una entrevista.

Eso hace que la creación de nuevas funciones, aprovechar la IA y otros avances, sea aún más esencial, ya que buscamos ver si una herramienta emerge como un líder claro en esta área particular de SaaS.

"En vivo colaboración multiusuario, todavía no existe ninguna otra herramienta que haya hecho lo que hemos hecho con grandes archivos de audio sin comprimir. Eso no es poca cosa, y ha tomado tiempo hacerlo bien ”, dijo Mason. “He visto este manifiesto de transición de documentos a hojas de cálculo y diseño de productos. Nadie hubiera pensado que algo como el diseño del producto fuera un gran espacio, pero solo al tomar estas herramientas para la colaboración y portarlas con éxito a la nube, han surgido compañías como Figma. Y así es como nos involucramos aquí ".


Source link