Ícono del sitio La Neta Neta

Inicio de clonación de audio impulsada por IA da voz al chatbot de Einstein

Inicio de clonación de audio impulsada por IA da voz al chatbot de Einstein

Tendrá que aguzar el oído para escuchar este fragmento de deepfakery que emerge del loco mundo de los medios sintetizados: una versión digital de Albert Einstein, con un voz sintetizada que ha sido (re) creado utilizando tecnología de clonación de voz de IA basándose en grabaciones de audio de la voz real del famoso científico.

La startup detrás del deepfake de audio del “valle inquietante” de Einstein es Aflorithmic (cuya ronda de semillas cubrimos en febrero).

Si bien el motor de video que impulsa los componentes de desgarro de personajes en 3D de esta versión “humana digital” de Einstein es el trabajo de otra compañía de medios sintetizados, UneeQ, que aloja la versión interactiva del chatbot. en su sitio web.

Alforithmic dice que el “Einstein digital” pretende ser un escaparate de lo que pronto será posible con el comercio social conversacional. Lo cual es una forma elegante de decir que los deepfakes que parecen figuras históricas probablemente intentarán venderte pizza lo suficientemente pronto, como lo han hecho los observadores de la industria. advertido proféticamente.

La startup también dice que ve potencial educativo en llevar a figuras famosas y fallecidas a una “vida” interactiva.

O, bueno, una aproximación artificial de la misma: la “vida” es puramente virtual y la voz de Digital Einstein tampoco es un clon puramente tecnológico; Alforithmic dice que también trabajó con un actor para hacer el modelado de voz para el chatbot (porque de qué otra manera iba a conseguir que Digital Einstein pudiera decir palabras que la realidad nunca hubiera soñado decir, como, er, “blockchain ”?). Así que aquí también se está produciendo un poco más que un artificio de IA.

“Este es el próximo hito en la exhibición de la tecnología para hacer posible el comercio social conversacional”, nos dijo el director de operaciones de Alforithmic, Matt Lehmann. “Todavía hay más de una falla que resolver, así como desafíos tecnológicos que superar, pero en general creemos que esta es una buena manera de mostrar hacia dónde se está moviendo esto”.

en un entrada en el blog discutiendo cómo recreó la voz de Einstein, la startup escribe sobre el progreso que logró en un elemento desafiante asociado con la versión del chatbot, diciendo que fue capaz de reducir el tiempo de respuesta entre la conversión del texto de entrada del motor de conocimiento computacional y la capacidad de su API para representar un respuesta expresada, de 12 segundos iniciales a menos de tres (lo que denomina “casi en tiempo real”). Pero todavía es un retraso suficiente para garantizar que el bot no pueda escapar de ser un poco tedioso.

Las leyes que protegen los datos y / o la imagen de las personas, mientras tanto, presentan un desafío legal y / o ético para crear tales “clones digitales” de seres humanos vivos, al menos no sin preguntar (y probablemente pagando) primero.

Por supuesto, las figuras históricas no están presentes para hacer preguntas incómodas sobre la ética de la apropiación de su semejanza para vender cosas (aunque solo sea la tecnología de clonación en sí, en esta etapa incipiente). Aunque los derechos de licencia todavía pueden aplicarse, y de hecho lo hacen en el caso de Einstein.

“Sus derechos recaen en la Universidad Hebrea de Jerusalén, que es socia en este proyecto”, dice Lehmann, antes de “admitir el elemento de licencia de artista de la actuación de” clonación de voz “de Einstein. “De hecho, en realidad no clonamos la voz de Einstein como tal, sino que encontramos inspiración en grabaciones originales así como en películas. El actor de voz que nos ayudó a modelar su voz es un gran admirador y su actuación cautivó muy bien al personaje de Einstein, pensamos ”.

Resulta que la verdad sobre las “mentiras” de alta tecnología es en sí misma un pastel de capas. Pero con los deepfakes no es la sofisticación de la tecnología lo que importa tanto como el impacto que tiene el contenido, y eso siempre dependerá del contexto. Y por muy bien (o mal) que se haga la falsificación, la forma en que las personas responden a lo que ven y oyen puede cambiar toda la narrativa, de una historia positiva (medios sintetizados creativos / educativos) a algo profundamente negativo (deepfakes alarmantes y engañosos).

La preocupación por el potencial de que los deepfakes se conviertan en una herramienta de desinformación también está aumentando, a medida que la tecnología se vuelve más sofisticada, lo que ayuda a impulsar los movimientos hacia la regulación de la IA en Europa, donde se encuentran las dos entidades principales responsables de “Digital Einstein”.

A principios de esta semana, un borrador filtrado de una propuesta legislativa entrante sobre reglas paneuropeas para aplicaciones de inteligencia artificial de “alto riesgo” incluía algunas secciones específicamente dirigidas a los deepfakes.

Según el plan, los legisladores parecen dispuestos a proponer “reglas de transparencia armonizadas” para los sistemas de inteligencia artificial que están diseñados para interactuar con los humanos y los que se utilizan para generar o manipular imágenes, audio o contenido de video. Por lo tanto, es probable que un futuro chatbot de Digital Einstein (o argumento de venta) deba declararse inequívocamente artificial antes de comenzar a fingirlo, para evitar la necesidad de que los usuarios de Internet tengan que aplicar un virtual Prueba de Voight-Kampff.

Por ahora, sin embargo, el chatbot interactivo de Digital Einstein de sonido erudito todavía tiene suficiente retraso como para regalar el juego. Sus creadores también están etiquetando claramente su creación con la esperanza de vender su visión del comercio social impulsado por la inteligencia artificial a otras empresas.


Source link
Salir de la versión móvil