Google está creando una IA que convierte descripciones de texto en música

Google está creando una IA que convierte descripciones de texto en música

Google está trabajando en un bot de IA llamado MúsicaLM que puede crear música a partir de simples entradas de texto. La IA ha ido entrando en la conciencia pública durante los últimos años, pero las cosas explotaron el año pasado con la presentación de ChatGPT de Open AI. El chatbot puede hacer una gran cantidad de cosas, como escribir historias, generar chistes originales, explicar temas científicos complejos, resolver problemas matemáticos e incluso ofrecer terapia, entre otras cosas.

Google ha creado un robot de inteligencia artificial llamado MusicLM que, según la compañía, puede generar música de alta fidelidad a partir de descripciones de texto o fragmentos de sonido, y crear canciones basadas en géneros y estilos específicos que menciona el usuario. También puede utilizar una melodía tarareada o silbada. En un artículo de investigación, los investigadores de Google dijeron: “MusicLM presenta el proceso de generación de música condicional como una tarea de modelado jerárquico de secuencia a secuencia y genera música a 24 kHz que permanece constante durante varios minutos”. Los investigadores también dicen que el robot puede cumplir los criterios de entrada mejor que cualquier IA existente que produzca música, e incluso superarlos en términos de calidad de audio.

Música generada por IA

“/>

Google ha subido un montón de fragmentos de audio que se dice que fueron creados con MusicLM. La IA generó clips de audio de 30 segundos con descripciones que incluyen un género o instrumentos específicos. Algunos de los clips de cinco minutos de duración se crearon enteramente basándose en descripciones de una o dos palabras, como “tecno melódico”, “swing” o “jazz relajante”. No es probable que los resultados hagan que nadie olvide a Beethoven o Mozart, pero suenan lo suficientemente naturales como para hacer casi imposible creer que los compositores humanos no los escribieron.

Además de las indicaciones de texto, MusicLM también puede recibir instrucciones mediante imágenes. Los usuarios pueden configurar los niveles de experiencia del músico AI para ajustar la calidad de salida. El bot puede incluso crear música inspirada en lugares y se le puede pedir que cree música para actividades particulares, como meditación o entrenamiento. MusicLM puede generar voces humanas, pero suenan distorsionadas, con letras en inglés que suenan más a una ensalada de palabras que a una canción real. Ed Sheeran y Taylor Swift no tienen que preocuparse por una competencia inminente todavía.

MusicLM está lejos de ser el primer generador de música moderno con IA. Los intentos anteriores incluyen Riffusion, Dance Diffusion y Jukebox de OpenAI, pero ninguno de ellos ha producido resultados tan aterradoramente impresionantes como MusicLM. Con más tiempo y material de capacitación, la nueva IA podría volverse aún más realista y “humana”, pero eso también podría causarle a Google problemas legales con los músicos por usar su música para entrenar el modelo de IA. Eso es exactamente lo que sucedió recientemente cuando tres artistas destacados demandaron a Stability AI, Midjourney y DeviantArt por supuestas violaciones de derechos de autor. A pesar de los posibles problemas legales, es probable que sea sólo cuestión de tiempo antes de que MúsicaLM presenta creaciones que son verdaderamente indistinguibles de la música creada por compositores humanos.

Fuente: Google/GitHub, arXiv


Source link