Microsoft mejora sus traducciones de IA con Z-Code

Microsoft mejora sus traducciones de IA con Z-Code

microsoft hoy Anunciado una actualización de sus servicios de traducción que, gracias a las nuevas técnicas de aprendizaje automático, promete traducciones significativamente mejoradas entre una gran cantidad de pares de idiomas. Basado en su Código Z del proyecto, que utiliza un enfoque de “Mezcla de expertos de repuesto”, estos nuevos modelos ahora suelen obtener una puntuación entre un 3 % y un 15 % mejor que los modelos anteriores de la empresa durante las evaluaciones ciegas. Z-Code es parte de la iniciativa XYZ-Code más amplia de Microsoft que busca combinar modelos de texto, visión y audio en varios idiomas para crear sistemas de IA más potentes y útiles.

La “Mezcla de expertos” no es una técnica completamente nueva, pero es especialmente útil en el contexto de la traducción. En esencia, el sistema básicamente divide las tareas en múltiples subtareas y luego las delega a modelos más pequeños y especializados llamados “expertos”. Luego, el modelo decide qué tarea delegar a qué experto, según sus propias predicciones. Muy simplificado, puede considerarlo como un modelo que incluye múltiples modelos más especializados.

Una nueva clase de modelos Z-Code Mixture of Experts está impulsando mejoras de rendimiento en Traductor, un servicio cognitivo de Microsoft Azure. Créditos de imagen: microsoft

“Con Z-Code realmente estamos logrando un progreso increíble porque estamos aprovechando el aprendizaje por transferencia y el aprendizaje multitarea a partir de datos monolingües y multilingües para crear un modelo de lenguaje de última generación que creemos que tiene la mejor combinación de calidad, rendimiento y eficiencia que podemos brindar a nuestros clientes”, dijo Xuedong Huang, miembro técnico de Microsoft y director de tecnología de Azure AI.

El resultado de esto es un nuevo sistema que ahora puede, por ejemplo, traducir directamente entre 10 idiomas, lo que elimina la necesidad de múltiples sistemas. Microsoft también comenzó recientemente a usar modelos Z-Code para mejorar otras características de sus sistemas de inteligencia artificial, incluido el reconocimiento de entidades, el resumen de texto, la clasificación de texto personalizado y la extracción de frases clave. Sin embargo, esta es la primera vez que utiliza este enfoque para un servicio de traducción.

Tradicionalmente, los modelos de traducción son extremadamente grandes, lo que dificulta llevarlos a un entorno de producción. Sin embargo, el equipo de Microsoft ha optado por un enfoque “escaso”, que solo activa una pequeña cantidad de parámetros del modelo por tarea en lugar de todo el sistema. “Eso los hace mucho más rentables para operar, de la misma manera que es más barato y más eficiente calentar su casa solo en invierno durante las horas del día que lo necesita y en los espacios que usa regularmente, en lugar de mantener un horno funcionando a pleno rendimiento todo el tiempo”, explica el equipo en el anuncio de hoy.


Source link