Un nuevo proyecto de la incubadora interna de Microsoft, Microsoft Garage, presenta una visión diferente de las transcripciones de reuniones. Si bien hoy en día hay una serie de aplicaciones de transcripción en tiempo real para usar en su teléfono, como Otter.ai o la aplicación Recorder de Google para dispositivos Pixel, por ejemplo, la nueva aplicación Group Transcribe de Microsoft reinventa las transcripciones de reuniones como un proceso más colaborativo, donde todos simultáneamente graba la reunión en su propio dispositivo para una mayor precisión. También ofrece traducción en tiempo real para idiomas hablados en más de 80 lugares distintos.
Para usar la aplicación, una persona primero iniciaría la reunión en su propio dispositivo. Luego, pueden invitar a los demás asistentes a la reunión a unirse a la sesión a través de Bluetooth, un código QR escaneable o compartiendo un enlace. Después de que los demás participantes se unan a la sesión y comience la reunión, cada persona verá la transcripción aparecer en tiempo real en su propio dispositivo.
La aplicación, que funciona con tecnología de voz y lenguaje de inteligencia artificial, puede transcribir con mayor precisión y atribución de orador en función del volumen del orador capturado por el micrófono de cada teléfono que se utiliza en la reunión.
Al comparar el nivel del volumen de voz de una persona, el servicio en la nube intenta determinar qué dispositivo está más cerca del hablante y las preferencias de idioma de ese hablante. Esto significa que los altavoces también están etiquetados con precisión en la aplicación, lo que puede ser un desafío para otras aplicaciones de transcripción en las que solo una persona está grabando.
Además, si los participantes de la reunión quieren hablar en su propio idioma, la aplicación puede proporcionar la traducción a los dispositivos de otras personas en su propio idioma.
Microsoft dice que la aplicación está diseñada teniendo en cuenta la accesibilidad, ya que facilita que las personas sordas, con problemas de audición y hablantes no nativos participen más plenamente en las reuniones siguiendo las transcripciones y traducciones en vivo.
El proyecto en sí fue creado por empleados de Microsoft que, en conjunto, hablan más de una docena de idiomas y dialectos diferentes.
“Esta puede ser una herramienta fantástica para la comunicación. Lo que me encantaría ver es que esto rompa las barreras para las personas que hablan varios idiomas ”, dijo Franklin Munoz, director de desarrollo principal, al presentar el proyecto.
Como la mayoría de los servicios de transcripción basados en la nube, la aplicación no debe usarse para reuniones altamente confidenciales. Sin embargo, Microsoft ha creado controles granulares de datos y privacidad que permiten a los usuarios decidir si quieren compartir los datos de sus conversaciones o cuándo.
Para que funcione, los datos de entrada de audio y texto recopilados se envían a las tecnologías de traducción y reconocimiento de voz en línea de Microsoft, aunque con un identificador generado aleatoriamente, no con su nombre real.
Si bien Microsoft no guarda las transcripciones ni las grabaciones de la reunión después del hecho, se guardan en su dispositivo, la aplicación anima a los participantes a “contribuir” con las grabaciones de sus reuniones a Microsoft para que pueda mejorar el servicio.
Esto permite a Microsoft retener las transcripciones de texto generadas por reconocimiento de voz y audio cuando todos los participantes de la reunión aceptan participar en esa sesión. Al revisar los datos, Microsoft apunta a mejorar sus capacidades de reconocimiento de voz y atribución de oradores a lo largo del tiempo, dice. Los empleados de Microsoft y los contratistas de otras empresas que trabajan para Microsoft accederán a los datos del usuario bajo NDA, pero no incluirán ninguna de las credenciales de cuenta de los oradores.
Los revisores también solo tendrán acceso a fragmentos aleatorios de audio, no a grabaciones completas. Y Microsoft dice que “desidentifica” las grabaciones de reuniones eliminando largas cadenas de números que podrían representar cosas como números de tarjetas de crédito o números de teléfono, por ejemplo. Los usuarios pueden eliminar sus grabaciones previamente compartidas en cualquier momento, pero de lo contrario, se conservan hasta por 2 años en servidores encriptados, dice la compañía.
Debido a que no existe una forma para que una empresa, a nivel de administrador, configure o bloquee la configuración de “contribución” para todos los usuarios, las personas deben sopesar cuidadosamente las ventajas y los riesgos de dicho servicio. También es un proyecto de Microsoft Garage, lo que significa que está destinado a ser más experimental y podría cerrarse en cualquier momento.
Actualmente, la aplicación Group Transcribe solo está disponible en iOS.
Source link