Inicio de clonación de audio impulsada por IA da voz al chatbot de Einstein

Inicio de clonación de audio impulsada por IA da voz al chatbot de Einstein

Tendrá que aguzar el oído para escuchar este fragmento de deepfakery que surge del loco mundo de los medios sintetizados: una versión digital de Albert Einstein, con una voz sintetizada que ha sido (re) creada utilizando tecnología de clonación de voz de IA basada en grabaciones de audio de la voz real del famoso científico.

La startup detrás del deepfake de audio del “valle inquietante” de Einstein es Aflorithmic (cuya ronda de semillas cubrimos en febrero).

Mientras que el motor de video que impulsa los componentes de desgarro de personajes 3D de esta versión “humana digital” de Einstein es el trabajo de otra compañía de medios sintetizados, UneeQ, que aloja la versión interactiva del chatbot en su sitio web.

Alforithmic dice que el “Einstein digital” pretende ser un escaparate de lo que pronto será posible con el comercio social conversacional. Lo cual es una forma elegante de decir deepfakes que parecen figuras históricas que probablemente intentarán venderte pizza lo suficientemente pronto, como advirtieron los observadores de la industria.

La startup también dice que ve potencial educativo en llevar a figuras famosas y fallecidas a una “vida” interactiva.

O, bueno, una aproximación artificial de la misma: la “vida” es puramente virtual y la voz de Digital Einstein tampoco es un clon puramente tecnológico; Alforithmic dice que también trabajó con un actor para hacer el modelado de voz para el chatbot (porque de qué otra manera iba a conseguir que Digital Einstein pudiera decir palabras que la realidad nunca hubiera soñado decir, como, er, “blockchain ”?). Así que aquí también se está produciendo un poco más que un artificio de IA.

“Este es el próximo hito en la exhibición de la tecnología para hacer posible el comercio social conversacional”, nos dijo el director de operaciones de Alforithmic, Matt Lehmann. “Todavía hay más de una falla que resolver, así como desafíos tecnológicos que superar, pero en general creemos que esta es una buena manera de mostrar hacia dónde se está moviendo esto”.

En una publicación de blog que analiza cómo recreó la voz de Einstein, la startup escribe sobre el progreso que logró en un elemento desafiante asociado con la versión del chatbot, diciendo que pudo reducir el tiempo de respuesta entre el cambio de texto de entrada del motor de conocimiento computacional a su API. capaz de generar una respuesta expresada, desde los primeros 12 segundos hasta menos de tres (lo que denomina “casi en tiempo real”). Pero todavía es un retraso suficiente para garantizar que el bot no pueda escapar de ser un poco tedioso.

Las leyes que protegen los datos y / o la imagen de las personas, mientras tanto, presentan un desafío legal y / o ético para crear tales “clones digitales” de seres humanos vivos, al menos no sin preguntar (y probablemente pagando) primero.

Por supuesto, las figuras históricas no están presentes para hacer preguntas incómodas sobre la ética de la apropiación de su semejanza para vender cosas (aunque solo sea la tecnología de clonación en sí, en esta etapa incipiente). Aunque los derechos de licencia todavía pueden aplicarse, y de hecho lo hacen en el caso de Einstein.

“Sus derechos recaen en la Universidad Hebrea de Jerusalén, que es socia en este proyecto”, dice Lehmann, antes de “admitir el elemento de licencia de artista de la actuación de” clonación de voz “de Einstein. “De hecho, en realidad no clonamos la voz de Einstein como tal, sino que encontramos inspiración en grabaciones originales así como en películas. El actor de voz que nos ayudó a modelar su voz es un gran admirador y su actuación cautivó muy bien al personaje de Einstein, pensamos ”.

Resulta que la verdad sobre las “mentiras” de alta tecnología es en sí misma un pastel de capas. Pero con los deepfakes no es la sofisticación de la tecnología lo que importa tanto como el impacto que tiene el contenido, y eso siempre dependerá del contexto. Y por muy bien (o mal) que se haga la falsificación, la forma en que las personas responden a lo que ven y oyen puede cambiar toda la narrativa, de una historia positiva (medios sintetizados creativos / educativos) a algo profundamente negativo (deepfakes alarmantes y engañosos).

La preocupación por el potencial de los deepfakes para convertirse en una herramienta de desinformación también está aumentando, a medida que la tecnología se vuelve más sofisticada, lo que ayuda a impulsar los movimientos hacia la regulación de la IA en Europa, donde se encuentran las dos entidades principales responsables de “Digital Einstein”.

A principios de esta semana, un borrador filtrado de una propuesta legislativa entrante sobre reglas paneuropeas para aplicaciones de inteligencia artificial de “alto riesgo” incluía algunas secciones específicamente dirigidas a los deepfakes.

Según el plan, los legisladores parecen dispuestos a proponer “reglas de transparencia armonizadas” para los sistemas de inteligencia artificial que están diseñados para interactuar con los humanos y los que se utilizan para generar o manipular imágenes, audio o contenido de video. Por lo tanto, es probable que un futuro chatbot de Digital Einstein (o argumento de venta) deba declararse inequívocamente artificial antes de comenzar a fingirlo, para evitar la necesidad de que los usuarios de Internet tengan que aplicar una prueba virtual de Voight-Kampff.

Por ahora, sin embargo, el chatbot interactivo de Digital Einstein de sonido erudito todavía tiene suficiente retraso como para regalar el juego. Sus creadores también están etiquetando claramente su creación con la esperanza de vender su visión del comercio social impulsado por la inteligencia artificial a otras empresas.


Source link