Resolviendo el problema de la globalización del entretenimiento con IA y ML

Resolviendo el problema de la globalización del entretenimiento con IA y ML

Teresa Phillips Colaboradora

Teresa Phillips es directora ejecutiva y cofundadora de Esferaxuna empresa de datos y tecnología pionera en la culturalización de los medios para la distribución internacional de cine y televisión.

La reciente controversia en torno a la malas traducciones encontrado en el éxito de Netflix “Squid Game” y otras peliculas destaca los desafíos de la tecnología al lanzar contenido que une idiomas y culturas a nivel internacional.

Cada año, en la industria mundial de los medios y el entretenimiento, se lanzan decenas de miles de películas y episodios de televisión exhibidos en cientos de plataformas de transmisión con la esperanza de encontrar una audiencia entre los 7200 millones de personas que viven en casi 200 países. Ningún público habla con fluidez los aproximadamente 7.000 idiomas reconocidos. Si el objetivo es lanzar el contenido a nivel internacional, los subtítulos y los doblajes de audio deben estar preparados para su distribución global.

Conocido en la industria como “localización”, la creación de “subs y doblajes” ha sido, durante décadas, una proceso centrado en el ser humano, donde alguien con un conocimiento profundo de otro idioma se sienta en una habitación, lee una transcripción del diálogo en pantalla, mira el contenido del idioma original (si está disponible) y lo traduce a un guión de doblaje de audio. No es raro que este paso tome varias semanas por idioma de principio a fin.

Una vez que se completan las traducciones, los actores de doblaje interpretan el guión y hacen todo lo posible para que la acción y los movimientos de los labios coincidan lo más posible. Los doblajes de audio siguen al diálogo de corte final y luego se generan subtítulos a partir de cada doblaje de audio. Cualquier compromiso hecho en la traducción del idioma puede, entonces, estar sujeto a un mayor compromiso en la producción de subtítulos. Es fácil ver dónde pueden ocurrir errores de traducción o cambios en una historia.

El proceso de localización más concienzudo incluye cierto nivel de conciencia cultural porque algunas palabras, acciones o contextos no son universalmente traducibles. Para este propósito, el director de la película ganadora del Oscar 2019 “Parasite”, Bong Joon-ho, envió notas detalladas a su equipo de traducción antes de que comenzaran a trabajar. pipa y otros han señalado que las limitaciones de tiempo, el espacio de pantalla disponible para los subtítulos y la necesidad de comprensión cultural complican aún más el proceso. Aún así, cuando se hacen bien, contribuyen a niveles más altos de disfrute de la película.

El crecimiento exponencial de las plataformas de distribución y el flujo creciente y continuo de contenido nuevo están empujando a los involucrados en el proceso de localización a buscar nuevas formas de acelerar la producción y aumentar la precisión de la traducción. La inteligencia artificial (IA) y el aprendizaje automático (ML) son respuestas muy esperadas a este problema, pero ninguna ha llegado al punto de reemplazar el componente de localización humana. Los directores de títulos como “Squid Game” o “Parasite” todavía no están preparados para dar ese salto. Este es el por qué.

La cultura importa

Primero, la traducción literal es incapaz de captar el 100% de los matices lingüísticos, culturales o contextuales de la historia incluidos en el guión, la inflexión o la acción. Las propias empresas de IA admiten estas limitaciones, refiriéndose comúnmente a las traducciones automáticas como “más como diccionarios que traductoresy recordarnos que las computadoras solo son capaces de hacer lo que les enseñamos mientras afirman que carecen de comprensión.

Por ejemplo, el título en inglés del primer episodio de “Squid Game” es “Luz roja, luz verde.” Esto se refiere al nombre del juego de niños que se juega en el primer episodio. El título original en coreano es “무궁화 꽃이 피던 날” (“Mugunghwa Kkoch-I Pideon Nal”), que se traduce directamente como “El día que floreció Mugunghwa”, que no tiene nada que ver con el juego al que están jugando.

En la cultura coreana, el título simboliza nuevos comienzos, que es la promesa de los protagonistas del juego al ganador. “Luz roja, luz verde” está relacionado con el episodio, pero pierde la referencia cultural más amplia de un nuevo comienzo prometido para las personas con mala suerte, un tema importante de la serie. Algunos pueden creer que nombrar el episodio después del juego jugado porque los traductores desconocen la metáfora cultural del título original puede no ser gran cosa, pero lo es.

¿Cómo podemos esperar entrenar máquinas para que reconozcan estas diferencias y las apliquen de manera autónoma cuando los humanos no hacen la conexión y las aplican ellos mismos?

Saber versus saber

Una cosa es que una computadora traduzca del coreano al inglés. Otra cosa es que tenga conocimiento sobre las diferencias en las relaciones como las de “Squid Game” (entre inmigrantes y nativos, extraños y familiares, empleados y jefes) y cómo esas relaciones impactan en la historia. Programar la comprensión cultural y el reconocimiento emocional en la IA es lo suficientemente desafiante, especialmente si esas emociones se muestran sin palabras, como la mirada en el rostro de alguien. Incluso entonces, es difícil predecir la respuesta facial emocional que puede cambiar con la cultura.

La IA todavía es un trabajo en progreso en lo que respecta a la explicabilidad, la interpretabilidad y el sesgo algorítmico. La idea de que las máquinas se autoentrenen a sí mismas es descabellada dada la posición de la industria con respecto a la ejecución de AI/ML. Para una industria creativa con mucho contenido como los medios y el entretenimiento, el contexto lo es todo; está la expresión del contexto del creador del contenido, y luego está la percepción que tiene la audiencia de él.

Además, con respecto a la distribución global, el contexto es igual a la cultura. Se logra un nirvana digital cuando un sistema puede orquestar y predecir el audio, el video y el texto, además de las múltiples capas de matices culturales que están en juego en cualquier marco, escena, tema y nivel de género. Básicamente, todo comienza con datos de entrenamiento de buena calidad; esencialmente, adoptar un enfoque centrado en los datos en lugar de uno centrado en el modelo.

Informes recientes indican que Facebook detecta solo del 3% al 5% del contenido problemático en su plataforma. Incluso con millones de dólares disponibles para el desarrollo, es muy difícil programar la IA para comprender el contexto y la intención. Las soluciones de traducción totalmente autónomas aún están lejos, pero eso no significa que AI/ML no pueda reducir la carga de trabajo hoy. Puede.

A través del análisis de millones de películas y programas de televisión combinados con el conocimiento cultural de personas de casi 200 países, un proceso humano y de IA/ML de dos pasos puede proporcionar los conocimientos detallados necesarios para identificar contenido que cualquier país o cultura puede encontrar objetable. En la “culturización”, esta hoja de ruta cultural se usa luego en el proceso de localización para garantizar la continuidad de la historia, evitar errores culturales y obtener clasificaciones de edad globales, todo lo cual reduce el tiempo y los costos de posproducción sin riesgo regulatorio.

El público de hoy tiene más opciones de contenido que nunca. Ganar en el mercado global significa que los creadores de contenido deben prestar más atención a su audiencia, no solo en casa sino también en los mercados internacionales.

El camino más rápido hacia el éxito para los creadores de contenido y las plataformas de transmisión es trabajar con empresas que entienden las audiencias locales y lo que les importa para que su contenido no se pierda en la traducción.


Source link