Mozilla ha agregado una herramienta de traducción oficial a Firefox que no depende del procesamiento en la nube para hacer su trabajo, sino que realiza el proceso basado en el aprendizaje automático directamente en su propia computadora. Es un gran paso adelante para un servicio popular fuertemente ligado a gigantes como Google y Microsoft.
La herramienta de traducción, llamada Traducciones de Firefox, se puede agregar a su navegador aquí. Necesitará descargar algunos recursos la primera vez que traduzca un idioma y, presumiblemente, puede descargar modelos mejorados si es necesario, pero el trabajo de traducción real lo realiza su computadora, no en un centro de datos a un par de cientos de millas de distancia.
Esto es importante no porque mucha gente necesite traducir en sus navegadores sin conexión, como la puerta de malla para un submarino, no es realmente un caso de uso que tenga sentido. Más bien, el objetivo es reducir la dependencia final de los proveedores de la nube con motivos ocultos para una tarea que ya no requiere sus recursos.
Es el resultado del Proyecto Bergamot financiado por la UE, en el que Mozilla colaboró con varias universidades en un conjunto de herramientas de aprendizaje automático que harían posible la traducción sin conexión. Normalmente, este tipo de trabajo lo realizan los clústeres de GPU en los centros de datos, donde se implementarían modelos de lenguaje grandes (gigabytes de tamaño y con miles de millones de parámetros) para traducir la consulta de un usuario.
Pero si bien las herramientas basadas en la nube de Google y Microsoft (sin mencionar a DeepL y otros competidores emergentes) son precisas y rápidas (debido a su poder de cómputo casi ilimitado), existe un riesgo fundamental de privacidad y seguridad al enviar sus datos a un tercero. parte para ser analizada y devuelta. Para algunos, este riesgo es aceptable; otros preferirían no involucrar a los gigantes de la publicidad en Internet si no es necesario.
Si traduzco a Google el menú en el lugar de tapas, ¿comenzaré a recibir promociones de salchichas? Más importante aún, si alguien está traduciendo documentos médicos o de inmigración con una identificación y ubicación conocidas del dispositivo, ¿ICE llamará a la puerta? Hacer todo sin conexión tiene sentido para cualquiera que esté preocupado por las implicaciones de privacidad de usar un proveedor de nube para la traducción, sea cual sea la situación.
Probé rápidamente la calidad de la traducción y la encontré más que adecuada. Aquí hay una parte de la portada del medio de noticias en español El País:
¡Bastante bien! Por supuesto, tradujo El País como The Paris en el título de la pestaña, y hubo muchas otras frases cuestionables (aunque tradujo cada | como “Oh, es algo bueno”, bastante divertido). Pero muy poco de eso interfirió en la comprensión de la esencia
Y, en última instancia, eso es lo que la mayoría de las traducciones automáticas deben hacer: informar el significado básico. Para cualquier tipo de matiz o sutileza, es posible que incluso un modelo de idioma grande no pueda replicar el idioma, por lo que una persona bilingüe real es su mejor opción.
La principal limitación es probablemente la falta de idiomas. Google Translate admite más de cien: Firefox Translations hace incluso una docena: español, búlgaro, checo, estonio, alemán, islandés, italiano, noruego bokmal y nynorsk, persa, portugués y ruso. Eso deja bastante fuera, pero recuerde que este es solo el primer lanzamiento de un proyecto de una organización sin fines de lucro y un grupo de académicos, no un producto destacado de un imperio de Internet multimillonario que se extiende por todo el mundo.
De hecho, los creadores están solicitando activamente la ayuda de exponer una canalización de entrenamiento para dejar que los “entusiastas” entrenen nuevos modelos. Y también están solicitando comentarios para mejorar los modelos existentes. Este es un producto utilizable, ¡pero ni mucho menos terminado!
Source link