Un conjunto de nuevas características para Android podría aliviar algunas de las dificultades de vivir con discapacidades auditivas y otras condiciones. La transcripción en vivo, los subtítulos y el relevo usan el reconocimiento y la síntesis de voz para hacer que el contenido de su teléfono sea más accesible, en tiempo real.
Anunciado hoy en Google Como un evento de E / S en un segmento sorprendentemente largo de accesibilidad, todas las características se basan en algoritmos mejorados de voz a texto y de texto a voz, algunos de los cuales ahora se ejecutan en el dispositivo en lugar de enviar audio a un centro de datos para ser decodificado.
La primera característica que se destacó, la transcripción en vivo, ya fue mencionada por Google antes. Es una herramienta simple pero muy útil: abra la aplicación y el dispositivo escuchará sus alrededores y simplemente mostrará cualquier discurso que reconozca como texto en la pantalla.
Hemos visto esto en las aplicaciones y dispositivos de traducción, como el One Mini, y la transcripción de la reunión destacada ayer en Microsoft Build. Uno podría pensar que una herramienta tan sencilla está muy retrasada, pero de hecho, las circunstancias cotidianas, como hablar con un par de amigos en una cafetería, pueden ser muy difíciles para los sistemas de lenguaje natural entrenados en audio de un solo altavoz perfectamente grabado. Sin duda, ha sido un desafío mejorar el sistema hasta el punto en el que pueda rastrear múltiples oradores y mostrar transcripciones precisas rápidamente.
Eso debería ser increíblemente útil no solo para los millones de personas que no pueden escuchar lo que se dice, sino también para quienes no hablan bien el idioma y podrían usar el soporte de texto, o cualquier persona que vea un programa en silencio cuando se supone que es. dormir, o cualquier otra circunstancia en la que escuchar y comprender el habla no sea la mejor opción.
Los subtítulos en vivo deberían estar disponibles en Android Q cuando se publiquen, con algunas restricciones de dispositivo. La transcripción en vivo está disponible ahora, pero una advertencia indica que actualmente está en desarrollo. El relé en vivo aún está por llegar, pero mostrarlo en el escenario en una forma tan completa sugiere que no pasará mucho tiempo antes de que aparezca.
Source link