Musixmatch lanza una plataforma de podcasts para la transcripción impulsada por la IA y la comunidad

empresa con sede en Italia Musixmatch es bien conocido por proporcionar letras impulsadas por la comunidad a las principales plataformas de transmisión de música, incluidas Spotify, Apple Music, YouTube Music, Amazon Music y Tidal. Ahora se está lanzando una nueva plataforma para podcasts que combina la transcripción generada por IA y la edición verificada por la comunidad.

Si bien hay millones de programas y episodios de podcasts disponibles para los oyentes, Musixmatch argumenta que la búsqueda de podcasts no funciona. Como resultado, sugiere que muchos podcasts geniales no se conectan con fanáticos potenciales. Por lo tanto, está utilizando su experiencia en el entrenamiento de modelos de IA a través de letras y aprovechando su experiencia en NLP (procesamiento del lenguaje natural) para mejorar la transcripción, búsqueda, descubrimiento y uso compartido de podcasts.

La plataforma de podcasts de Musixmatch genera automáticamente transcripciones todos los días para algunos de los mejores episodios de podcasts en diferentes temas y gráficos. Está utilizando su arquitectura de modelo base de NLP, Umberto, para etiquetar palabras clave como lugares, personas y temas con ID de Wikipedia: ID alfanuméricos que están vinculados a temas en Wikipedia. (Por ejemplo, este enlace indica una ID de Wikipedia relacionada con TechCrunch).

Debido a este enfoque, dice que las personas que busquen estos temas en cualquier idioma obtendrán resultados precisos.

La puesta en marcha le explicó a TechCrunch que, en función de estas identificaciones, crea un gráfico de temas llamado TopicRank que clasifica los podcasts en función de factores como la cantidad de menciones en un episodio o la experiencia de los presentadores sobre el tema, lo que mejora los resultados de búsqueda de podcasts cuando los usuarios buscan Temas relacionados.

Créditos de imagen: Musixmatch

“Gracias a esta clasificación, las personas finalmente pueden buscar cualquier palabra clave en particular y encontrar podcasts transcritos que coincidan con su consulta, ordenados por relevancia. Nuestro índice de búsqueda devuelve una serie de resultados mucho más detallados y profundos que cualquier otro servicio de escucha que se base en metadatos RSS estándar y géneros y categorías predefinidos”, afirmó la empresa.

Cuando los usuarios buscan en la plataforma de podcasts de Musixmatch, muestra fragmentos de transcripciones donde se menciona la frase buscada. Si hacen clic en el resultado, el podcast comenzará a reproducirse directamente desde la marca de tiempo del fragmento que menciona la frase. Eso es bastante bueno para cuando necesitas escuchar un par de minutos de audio mientras investigas algo.

Musixmatch ha confiado durante mucho tiempo en su comunidad para realizar ediciones precisas en las letras, y ahora les pide a estos usuarios que hagan lo mismo con los podcasts. El nuevo portal de podcasts de la compañía también incluye una herramienta llamada Podcast Studio, que permite a los editores y propietarios de podcasts corregir la transcripción generada por IA, especialmente útil para cosas como personas y marcas o referencias culturales.

Si no hay transcripción para un episodio en particular, el propietario o miembro de la comunidad puede usar Podcast Studio para generar una. Musixmatch dice que la IA tarda aproximadamente cinco minutos en generar una transcripción de un episodio. Los oyentes habituales también pueden votar un episodio para la transcripción para que la comunidad los priorice.

Créditos de imagen: Musixmatch

Es importante tener en cuenta que en la plataforma de Musixmatch, las transcripciones generadas por IA tendrán etiquetas como “Orador 1” y “Orador 2”, mientras que los episodios editados por la comunidad tendrán etiquetas con los nombres de los oradores, junto con una etiqueta “verificado”.

Transcripción y etiquetas de podcast curadas por humanos. Créditos de imagen: Musixmatch

La compañía también está facilitando el intercambio al mostrar tarjetas que tienen fragmentos de texto del podcast con un enlace para compartir. Además, está trabajando en una función llamada audiogramas, que son pequeños videos compartibles que incluyen audio y fragmentos de texto desplazables de un podcast.

Créditos de imagen: Musixmatch

Musixmatch no quiere guardar todos estos datos para sí mismo. Está permitiendo a los propietarios de podcasts exportar transcripciones a sus fuentes web y aplicaciones. Y dado que estos textos son compatibles con SEO, argumenta que facilitará que los oyentes los busquen.

Algunos socios de Musixmatch que dice que están usando sus herramientas para la transcripción incluyen “The Talent Show” de The Financial Times; “Más allá de lo ordinario” y “Por qué corro” de Red Bull; y toda la producción de Chora Media.

Si bien la plataforma de podcasts de Musixmatch ofrece funciones para los oyentes, no intenta ser solo un reproductor de podcasts. La startup argumenta que sus competidores son empresas que trabajan en el espacio de análisis de audio, incluidas las aplicaciones que brindan servicios de transcripción (como Podcastle).

“Creemos que el análisis de audio (IA, semántica, etc.) será imprescindible en el futuro cercano, para muchos casos de uso diferentes. Estamos en una posición única para brindar ese servicio para podcasts debido a nuestra tecnología de análisis de contenido impulsada por IA, nuestra comunidad comprometida y nuestro rol dentro de los DSP. [Digital Streaming Platforms]para lo cual ya sindicamos contenido de terceros”, dijo a TechCrunch el director de producto de la compañía, Marco Paglia, por correo electrónico.

Agregó que uno de los objetivos de la empresa es convertirse en un proveedor de transcripciones verificadas para otros servicios, al igual que sus ofertas en el espacio de las letras.

Source link