Cada segundo se efectúan más de 90.000 consultas en Google, cuyo motor de búsqueda acapara el 90% de la cuota de mercado, según el portal de estadísticas Statista. Estas cifras estratosféricas muestran el éxito del buscador que muchos confunden con la puerta de internet. Pero la compañía de Mountain View ha decidido perfeccionarlo. El resultado es MUM, siglas de Multitask Unified Model (algo así como Modelo Unificado de Multitarea), una herramienta de inteligencia artificial “mil veces más potente” que la anterior, según la empresa, entrenada en 75 idiomas a la vez con un propósito: entender con mayor precisión qué quiere saber el usuario, y ofrecerle los resultados más relevantes de las fuentes más fiables. La compañía ya está probando la herramienta en las búsquedas que tienen que ver con la pandemia y las vacunas.
Pandu Nayak, vicepresidente del departamento de Google encargado de la herramienta de búsqueda,dio detalles sobre la nueva herramienta este lunes por videollamada ante un grupo de periodistas internacionales. Según Nayak, MUM puede comprender y generar lenguaje y es un modelo “mucho más grande con muchos más parámetros y, por lo tanto, capaz de hacer mucho más” que BERT, el algoritmo que establece en la actualidad los resultados que el buscador muestra a cada usuario.
El desafío de MUM tiene que ver con las diferentes maneras en que los usuarios se refieren a un mismo término. Por ejemplo, Google ha detectado que para buscar información sobre las vacunas contra la COVID-19 se utilizan más de 800 palabras o expresiones diferentes en más de 50 idiomas: de “Coronavaccin Pfizer” a “mRNA-1273” o “CoVaccine”. Para una persona, identificar todos estos términos requeriría cientos de horas. Pero con MUM se puede hacer en cuestión de segundos.
“La realidad es que la gente tiene necesidades complejas y formular consultas a partir de esas necesidades complejas no siempre es tan fácil”, explicó Nayak. De hecho, la tecnológica calcula que un usuario realiza hasta ocho consultas en promedio para dar respuesta a búsquedas complejas. El objetivo es que MUM simplifique este proceso. “Cuando los usuarios acuden a nosotros con una consulta sobre alguna vacuna, debemos reconocer qué están preguntando al respecto y generar la experiencia más adecuada”. Google ha utilizado MUM para identificar correctamente cómo los usuarios se refieren a las diferentes vacunas y, después, intentar ofrecerles la información “más reciente y fiable”.
Entrenado con “contenidos de alta calidad”
Otro ejemplo son las distintas formas en las que los usuarios se han referido al SARS-CoV-2 durante la pandemia. “Qué es el coronavirus” fue la pregunta que más se hicieron los internautas españoles en las primeras semanas de 2020. También hay muchos productos o asuntos que tienen nombres diferentes según el idioma o el habla de cada país o incluso dependiendo de los matices culturales. Es el caso de soda o refresco, jersey o suéter o fútbol —americano o europeo—. Para superar esta barrera de la lengua, MUM ha sido entrenado “con contenidos de alta calidad” en más de 75 idiomas diferentes a la vez. Algo que, según destaca Nayak, sirve para crear sistemas robustos en todas las lenguas y “brinda muchos beneficios a la hora de transferir conocimientos de lenguajes ricos en datos a aquellos pobres”.
Más información
El resultado es que MUM no tiene que aprender una nueva capacidad o habilidad en cada nuevo idioma, sino que puede transferir lo que ha aprendido de una lengua a otra. Esto resulta útil para incorporar todo tipo de mejoras “rápidamente y a gran escala, incluso cuando no hay muchos datos con los que entrenar a la herramienta”. En el caso de las vacunas, con solo una pequeña muestra de sus nombres oficiales, MUM fue capaz de identificar rápidamente las variaciones entre los diferentes idiomas, según cuenta el experto.
El potencial real de esta herramienta aún es una incógnita, pero a priori resulta bastante prometedora. Nayak considera que servirá para crear a medio plazo formas completamente nuevas de buscar y analizar la información. “Si tuviera que resumir lo que hace Google en una oración, sería producir resultados relevantes de fuentes autorizadas fiables siempre que sea posible”, ha asegurado el vicepresidente de la compañía.
Al ser multimodal, este sistema es capaz de asociar la comprensión de texto a imágenes. Google pretende que en el futuro también funcione con otras modalidades como el vídeo o el audio. “Podríamos hacer una foto a unas botas de montaña y preguntar al buscador si esas botas son buenas para escalar el monte Fuji”, explicó Nayak. Como el sistema puede comprender tanto imágenes como texto, lo ideal sería que inmediatamente analizara si esas botas son una buena opción. Podría tener en cuenta, por ejemplo, si cubren o no los tobillos. Google ha asegurado que en los próximos meses y años lanzará nuevas funciones y mejoras de esta herramienta para sus productos.
Puedes seguir a EL PAÍS TECNOLOGÍA en Facebook y Twitter o apuntarte aquí para recibir nuestra newsletter semanal.