Google expande el impulso de idiomas en India para atender a personas que no hablan inglés

Google expande el impulso de idiomas en India para atender a personas que no hablan inglés

by

in

Hay más de 600 millones de usuarios de Internet en la India, pero solo una fracción de esta población habla inglés con fluidez. Sin embargo, la mayoría de los servicios en línea y gran parte del contenido de la web actualmente están disponibles exclusivamente en inglés.

Esta barrera del idioma continúa contribuyendo a una brecha digital en el segundo mercado de Internet más grande del mundo que ha limitado la interpretación de la World Wide Web de cientos de millones de usuarios a unos pocos sitios web y servicios.

Por lo tanto, no sorprende que los gigantes tecnológicos estadounidenses, que cuentan con mercados emergentes como India, continúen creciendo. intentan cada vez más hacer que la web y sus servicios sean accesibles a más personas.

Google, que hasta ahora ha liderado este esfuerzo, el jueves anunció una serie de cambios que está implementando en algunos de sus servicios para que hablen más idiomas locales y dio a conocer un enfoque completamente nuevo que está adoptando para traducir idiomas.

Además, Google dijo que planea invertir en aprendizaje automático y esfuerzos de inteligencia artificial en el centro de investigación de Google en India y hacer que sus modelos de inteligencia artificial sean accesibles para todos en todo el ecosistema. La compañía, que considera a India como su mayor mercado por usuarios, y este año se comprometió a invertir más de $ 10 mil millones en el país durante los próximos años, también planea asociarse con nuevas empresas locales que atienden a los usuarios en los idiomas locales y “drásticamente”. mejorar la experiencia de los productos y servicios de Google para los usuarios de idiomas indios.

Cambios de producto

Los usuarios ahora podrán ver los resultados de sus consultas en tamil, telugu, bengalí y marathi, además del inglés y el hindi que están disponibles actualmente. La adición se produce cuatro años después de que Google agregó la pestaña Hindi a la página de búsqueda en India. La compañía dijo que el volumen de consultas de búsqueda en hindi creció más de 10 veces después de la introducción de esta pestaña. Si alguien prefiere ver su consulta en tamil, por ejemplo, ahora podrá configurar la pestaña tamil junto a inglés y alternar rápidamente entre las dos.

Obtener resultados de búsqueda en un idioma local es útil, pero a menudo las personas también desean realizar sus consultas en esos idiomas. Google dice que ha descubierto que escribir en un idioma que no sea el inglés es otro desafío que enfrentan los usuarios en la actualidad. “Como resultado, muchos usuarios buscan en inglés incluso si realmente prefieren ver los resultados en un idioma local que entienden”, dijo la compañía.

Para abordar este desafío, la Búsqueda comenzará a mostrar contenido relevante en los idiomas indios admitidos cuando corresponda, incluso si la consulta del idioma local está escrita en inglés. La función, que la compañía planea implementar durante el próximo mes, es compatible con cinco idiomas indios: hindi, bengalí, marathi, tamil y telugu.

Google también facilita a los usuarios cambiar rápidamente el idioma preferido en el que ven los resultados en una aplicación sin alterar la configuración de idioma del dispositivo. La función, que actualmente está disponible en Discover y Google Assistant, ahora se implementará en Maps. De manera similar, la función Tarea de Google Lens, que permite a los usuarios tomar una fotografía de un problema de matemáticas o ciencias y luego entrega su respuesta, ahora es compatible con el idioma hindi.

Kuril

Los ejecutivos de Google también detallaron un nuevo modelo de inteligencia artificial de idiomas, al que denominan Representaciones multilingües para idiomas indios (MuRIL), que ofrece más eficiencia y precisión en el manejo de la transliteración, las variaciones ortográficas y los idiomas mixtos. MuRIL proporciona soporte para texto transliterado, como cuando se escribe hindi con escritura romana, algo que faltaba en modelos anteriores de este tipo, dijo Partha Talukdar, investigadora científica de Google Research India, en un evento virtual el jueves.

La compañía dijo que entrenó el nuevo modelo con artículos en Wikipedia y textos de un conjunto de datos llamado Common Crawl. También lo entrenó en texto transliterado de, entre otras fuentes, Wikipedia (alimentado a través de los modelos de traducción automática neuronal existentes de Google). El resultado es que MuRIL maneja los idiomas indios mejor que los modelos de idioma más generales anteriores y puede lidiar con letras y palabras que se han transcrito, es decir, Google está utilizando las letras correspondientes más cercanas de un alfabeto o escritura diferente.

Además, el nuevo modelo le permite a Google “transferir conocimientos y capacitación de un idioma a otro”, dijo Talukdar, quien señaló que el modelo anterior en el que se basaba Google resultó no escalable. MuRIL supera significativamente al modelo anterior, en un 10% en texto nativo y un 27% en texto transliterado. MuRIL, que fue desarrollado por ejecutivos en India, es de código abierto.

MuRIL admite 16 idiomas indios e inglés.

Una de las muchas tareas en las que MuRIL es bueno es determinar el sentimiento de la oración. Por ejemplo, “Achha hua cuenta bandh nahi hua” se interpretaría previamente como con un significado negativo, pero MuRIL identifica correctamente esto como una declaración positiva. O tome la capacidad de clasificar a una persona frente a un lugar: ‘Shirdi ke sai baba’ se interpretaría previamente como un lugar, lo cual está mal, pero MuRIL lo interpreta correctamente como una persona.

Mas para seguir…


Source link