Los desarrolladores ahora están usando IA para aplicaciones de texto a música

Con el aumento de la popularidad de los modelos de lenguaje grande (LLM) y las herramientas de inteligencia artificial generativa como ChatGPT, los desarrolladores han encontrado casos de uso para moldear texto de diferentes maneras para casos de uso que van desde escribir correos electrónicos hasta resumir artículos. Ahora, buscan ayudarte a generar fragmentos de música con solo escribir algunas palabras.

Brett Baumanel desarrollador de PlayListAI (anteriormente LinupSupply), lanzó una nueva aplicación llamada explosión de canción en la App Store esta semana. La aplicación no tiene una curva de aprendizaje pronunciada. Sólo tienes que escribir un mensaje como “Música de piano relajante para escuchar mientras estudias” o “ritmos funky para una introducción de podcast” para permitir que la aplicación genere un clip musical.

Si no se le ocurre un mensaje, la aplicación tiene mensajes en diferentes categorías, incluidos video, lo-fi, podcast, juegos, meditación y muestra.

Créditos de imagen: explosión de canción

Bauman le dijo a TechCrunch que construyó el back-end de la aplicación usando Vercel y que la música se genera a través de Salto. Actualmente, existe una limitación de generación de 30 segundos y es posible que algunos resultados no sean de gran calidad. Bauman dijo que con el tiempo buscará aumentar la duración del clip musical generado y mejorar la calidad.

Songburst se puede probar gratis, pero ofrece una suscripción a $ 9,99 por mes o $ 79,99 por año. La suscripción le brinda 20 créditos de canciones por mes y la posibilidad de descargar pistas en formato mp3. Los usuarios también pueden comprar créditos adicionales en paquetes de cinco ($7,99), 10 ($11,99) o 20 ($15,99).

Bauman dijo que creó la aplicación porque hay pocas soluciones nativas de conversión de texto a música, simples y móviles, en las que no se utilicen tácticas de spam para obtener dinero de suscripción.

Sin embargo, no es el único que intenta crear una aplicación de conversión de texto a música ordenada. Akhil Tolanique ha creado aplicaciones como la aplicación de colaboración musical rapchatha lanzado CaseteAIque está disponible tanto en la web como en la App Store.

A nivel de entrada, CassetteAI funciona de manera similar a otras aplicaciones. Escribes un mensaje de música y produce una pista. Sin embargo, puede generar una muestra de hasta tres minutos de duración. El fabricante de la aplicación dijo que esto se debe a que la aplicación funciona en un modelo personalizado basado en la arquitectura jerárquica seq2seq y está entrenada en un conjunto de datos especializado para generar música libre de derechos de autor.

Créditos de imagen: IA en casete

La herramienta también proporciona una interfaz para que los usuarios creen diferentes versiones de las pistas generadas y las editen y mezclen para crear una nueva pista. Estas herramientas son bastante básicas, así que no esperes crear una pista maestra de varias capas a partir de esto todavía.

Interfaz Cassette AI para mezclar pistas. Créditos de imagen: IA en casete

Tolani dijo que la herramienta funcionaba en función de la lista de espera, pero que ahora la está abriendo a más personas. Le dijo a TechCrunch que también espera una suscripción profesional a Cassette AI con un precio de $ 4,99 por mes, que brindará a los usuarios acceso a una generación ilimitada de canciones y acceso a modelos de IA de mejor calidad para una mejor generación de canciones.

El desarrollador mencionó que Cassette AI es mejor que otros generadores de música como Mubert y Beatbot porque genera música de mejor calidad con un tiempo de respuesta más rápido. Añadió que con Cassette AI quiere respetar los límites éticos de la industria musical.

“Queremos que la gente vea la IA como una herramienta para la creación musical, no como un sustituto de los creadores: las calculadoras no reemplazaron a los matemáticos, simplemente facilitaron el cálculo de las cosas. Queremos que la producción musical sea accesible para todos para cualquier caso de uso”, dijo.

Estas herramientas están dirigidas principalmente a creadores, que pueden utilizar música libre de derechos de autor en sus vídeos o podcasts. Los desarrolladores también esperan que los músicos se den cuenta de sus herramientas y las combinen en su proceso de creación de muestras o canciones.

Además de los desarrolladores independientes, las principales empresas tecnológicas también están intentando solucionar el problema de la generación de texto a música. Google hizo pública su herramienta MusicLM durante la conferencia de desarrolladores Google I/O en mayo. En junio, Meta abrió su propio generador de música impulsado por inteligencia artificial llamado MusicGen.

Si bien los modelos están mejorando en lo que respecta a la calidad de las pistas generadas, existen preocupaciones con respecto a los datos de entrenamiento que utilizan para crear música. Para evitar problemas legales, OpenAI ha hecho que su modelo Jukebox sea de código abierto y ha prohibido a los usuarios crear música para casos de uso comercial. Luego están algunos músicos avanzados en IA como Grimes, que en abril invitó a sus fans a hacer canciones con su voz y dividir las regalías con ella.

Source link