La mayoría de las personas que utilizan herramientas de traducción impulsadas por IA lo hacen para tareas comunes y relativamente poco importantes, como comprender una sola frase o cita. Esos servicios básicos no son suficientes para una empresa que ofrece documentos técnicos en 15 idiomas, pero los modelos personalizados de traducción automática de Lengoo podrían ser la solución. Y con una nueva ronda de $ 20 MB, es posible que puedan generar una ventaja considerable.
El negocio de la traducción es grande, miles de millones y no va a ninguna parte. Es simplemente una tarea demasiado común para tener que publicar un documento, una pieza de software o un sitio web en vivo en varios idiomas, tal vez en docenas.
En estos días, ese trabajo lo realizan agencias de traducción, que emplean oradores expertos para ofrecer traducciones bajo demanda con un alto nivel de calidad. El auge de la traducción automática como una herramienta cotidiana no los ha afectado tanto como podría pensar, ya que el usuario portugués ocasional que utiliza la traducción de una página web incorporada de Google en un sitio web coreano es un caso de nicho, y cosas como la traducción de redes sociales. las publicaciones o las oraciones individuales no son realmente algo que puedas o quieras entregar a los profesionales.
En estos casos familiares, “suficientemente bueno” es la regla, ya que el significado básico es todo lo que alguien realmente quiere o necesita. Pero si está lanzando un producto en 10 mercados diferentes que hablan 10 idiomas diferentes, no será suficiente tener las instrucciones, advertencias, acuerdos legales o documentación técnica perfectos en un idioma y simplemente bien en los otros nueve.
Lengoo partió de un equipo que trabajaba en la automatización de ese flujo de trabajo entre empresas y traductores.
“El siguiente paso a tomar, obviamente, fue automatizar la traducción en sí”, dijo el CEO y fundador Christopher Kränzler. “Seguiremos necesitando humanos en el circuito durante mucho tiempo; el objetivo es llevar los modelos al nivel en el que sean realmente utilizables y el humano tenga menos traducciones que hacer”.
Dado que las capacidades de aprendizaje automático se mejoran constantemente, ese no es un objetivo poco realista. Otras empresas han comenzado por ese camino: DeepL y Lilt, por ejemplo, que presentaron sus casos mostrando mejoras importantes sobre los marcos de Google y Microsoft, pero nunca pretendieron eliminar a los humanos del proceso.
Lengoo repite su trabajo centrándose en la velocidad y la especificidad, es decir, creando un modelo de lenguaje que integra toda la jerga, las preferencias estilísticas y los requisitos de formato de un cliente determinado. Para hacer esto, crean un modelo de lenguaje personalizado capacitándolo no solo con los propios documentos y sitios web del cliente, sino agregando continuamente comentarios del proceso de traducción en sí.
“Tenemos una línea de capacitación automatizada para los modelos”, dijo Kränzler. Cuantas más personas contribuyan al proceso de corrección, más rápido se vuelve el proceso. Con el tiempo, llegamos a ser aproximadamente tres veces más rápidos que Google o DeepL “.
Un cliente nuevo puede comenzar con un modelo personalizado en unos pocos miles de documentos de los últimos dos años. Pero siempre que el modelo produce un texto que necesita ser corregido, recuerda esa corrección en particular y la integra con el resto de su entrenamiento.
Si bien la “calidad” de una traducción puede ser difícil de cuantificar objetivamente, en este caso no hay problema, porque trabajar como una herramienta de traductor humano significa que hay un control de calidad integrado. La calidad de la traducción se puede medir mediante la “distancia de corrección , ”Esencialmente la cantidad de cambios que el ser humano debe realizar en el texto sugerido del modelo. Menos correcciones no solo significan una mejor traducción, sino una más rápida, lo que significa que la calidad y la velocidad tienen métricas objetivas.
Las mejoras se han ganado a los clientes que desconfiaban de la automatización excesiva en el pasado.
“Al principio hubo resistencia”, admitió Kränzler. “La gente recurre a Google Translate para las traducciones diarias y ven que la calidad está mejorando; ellos y DeepL han estado educando al mercado, de verdad. La gente entiende ahora que si lo hace bien, la traducción automática funciona en un caso de uso profesional. Un gran cliente puede tener 30, 40, 50 traductores, y cada uno tiene su propio estilo … Podemos señalar que somos más rápidos y más baratos, pero también que la calidad, en términos de consistencia, aumenta “.
Aunque personalizar un modelo con los datos de un cliente no es un enfoque único, Lengoo parece haber construido una ventaja sobre sus rivales y grandes empresas más lentas que no pueden mejorar sus productos lo suficientemente rápido como para mantenerse al día. Y tienen la intención de solidificar esa ventaja renovando su pila tecnológica.
El problema es que, debido a que se basan en tecnologías de aprendizaje automático más o menos tradicionales, el ciclo de retroalimentación crucial del traductor-AI es limitado. La rapidez con la que se actualiza el modelo depende del uso que se le dé, pero no va a volver a entrenar un modelo grande solo para integrar algunos cientos de palabras más de contenido. Es costoso reentrenamiento computacionalmente, por lo que solo se puede hacer esporádicamente.
Pero Lengoo planea construir su propio marco de traducción automática neuronal más receptivo que integre las diversas canalizaciones y procesos involucrados. El resultado no mejoraría exactamente en tiempo real, pero incluiría la información más reciente de una manera mucho más rápida y menos complicada.
“Piense en ello como una mejora segmento por segmento”, dijo el líder de investigación aplicada Ahmad Taie (los segmentos varían en tamaño, pero generalmente son “fragmentos” lógicos de texto). “Traduces un segmento y, para el siguiente, ya tienes las mejoras realizadas en el modelo”.
Hacer que la característica clave del producto sea mejor, más rápida y más fácil de implementar cliente por cliente es clave para mantener a los clientes enganchados, por supuesto. Y aunque es probable que haya una competencia intensa en este espacio, Kranzler no espera que provenga de Google ni de ninguna de las grandes empresas existentes, que tienden a seguir un enfoque de adquisición e integración en lugar de uno de desarrollo ágil.
En cuanto a los traductores expertos humanos, el campo no los reemplazará, pero puede extender su efectividad, eventualmente, hasta un orden de magnitud, lo que puede reducir la fuerza laboral allí. Pero si los mercados internacionales continúan creciendo y con ellos la necesidad de traducción profesional, es posible que sigan el ritmo.
La ronda de 20 millones de dólares, liderada por Inkef Capital, permitirá a Lengoo dar el salto a los mercados de América del Norte, así como a otros europeos, e integrarse con más empresas. Los inversores existentes Redalpine, Creathor Ventures, Techstars (a partir de cuyo programa se originó la empresa) y los ángeles Matthias Hilpert y Michael Schmitt se unieron a la ronda, junto con los nuevos inversores Polipo Ventures y Volker Pyrtek.
Source link