Ícono del sitio La Neta Neta

La transcripción en vivo y los subtítulos en Android son una bendición para las personas con discapacidad auditiva

La transcripción en vivo y los subtítulos en Android son una bendición para las personas con discapacidad auditiva

Un conjunto de nuevas características para Android podría aliviar algunas de las dificultades de vivir con discapacidades auditivas y otras condiciones. La transcripción en vivo, los subtítulos y el relevo usan el reconocimiento y la síntesis de voz para hacer que el contenido de su teléfono sea más accesible, en tiempo real.

Anunciado hoy en Google Como un evento de E / S en un segmento sorprendentemente largo de accesibilidad, todas las características se basan en algoritmos mejorados de voz a texto y de texto a voz, algunos de los cuales ahora se ejecutan en el dispositivo en lugar de enviar audio a un centro de datos para ser decodificado.

La primera característica que se destacó, la transcripción en vivo, ya fue mencionada por Google antes. Es una herramienta simple pero muy útil: abra la aplicación y el dispositivo escuchará sus alrededores y simplemente mostrará cualquier discurso que reconozca como texto en la pantalla.

Hemos visto esto en las aplicaciones y dispositivos de traducción, como el One Mini, y la transcripción de la reunión destacada ayer en Microsoft Build. Uno podría pensar que una herramienta tan sencilla está muy retrasada, pero de hecho, las circunstancias cotidianas, como hablar con un par de amigos en una cafetería, pueden ser muy difíciles para los sistemas de lenguaje natural entrenados en audio de un solo altavoz perfectamente grabado. Sin duda, ha sido un desafío mejorar el sistema hasta el punto en el que pueda rastrear múltiples oradores y mostrar transcripciones precisas rápidamente.

Otra característica habilitada por esta capacidad mejorada de reconocimiento de voz es el subtitulado en vivo, que esencialmente hace lo mismo que antes, pero para el video. Ahora, cuando mira un video de YouTube, escucha un mensaje de voz o incluso toma una videollamada, podrá ver lo que la persona que está diciendo en ese momento, en tiempo real.

Eso debería ser increíblemente útil no solo para los millones de personas que no pueden escuchar lo que se dice, sino también para quienes no hablan bien el idioma y podrían usar el soporte de texto, o cualquier persona que vea un programa en silencio cuando se supone que es. dormir, o cualquier otra circunstancia en la que escuchar y comprender el habla no sea la mejor opción.

Subtitular llamadas telefónicas es algo que el CEO Sundar Pichai dijo que todavía está en desarrollo, pero la función de “retransmisión en vivo” que demostraron en el escenario mostró cómo podría funcionar. Una persona con discapacidad auditiva o que no puede hablar encontrará que una llamada telefónica ordinaria no tiene ningún valor. Pero el servicio de retransmisión en vivo convierte la llamada inmediatamente en texto, e inmediatamente convierte las respuestas de texto en un discurso que la persona en la línea puede escuchar.

Los subtítulos en vivo deberían estar disponibles en Android Q cuando se publiquen, con algunas restricciones de dispositivo. La transcripción en vivo está disponible ahora, pero una advertencia indica que actualmente está en desarrollo. El relé en vivo aún está por llegar, pero mostrarlo en el escenario en una forma tan completa sugiere que no pasará mucho tiempo antes de que aparezca.


Source link
Salir de la versión móvil