AI está ayudando a académicos a restaurar textos griegos antiguos en tablillas de piedra

AI está ayudando a académicos a restaurar textos griegos antiguos en tablillas de piedra

El aprendizaje automático y la IA pueden implementarse en tareas tan grandiosas como encontrar exoplanetas y crear personas fotorrealistas, pero las mismas técnicas también tienen algunas aplicaciones sorprendentes en el mundo académico: DeepMind ha creado un sistema de IA que ayuda a los estudiosos a comprender y recrear textos fragmentarios del griego antiguo en tablillas de piedra rotas.

Estas tablillas de arcilla, piedra o metal, inscritas hace 2.700 años, son fuentes primarias invaluables para la historia, la literatura y la antropología. Están cubiertos de letras, naturalmente, pero a menudo los milenios no han sido amables y no solo hay grietas y astillas, sino piezas completas que faltan que pueden comprender muchos símbolos.

Tales espacios, o lagunas, a veces son fáciles de completar: si escribí “la araña atrapó a la fl_”, cualquiera puede decirle que en realidad es “la araña atrapó a la mosca”. Pero, ¿y si le faltaran muchas más letras, y en un idioma muerto, para colmo? No es tan fácil llenar los huecos.

Hacerlo es una ciencia (y un arte) llamada epigrafía, e implica tanto la comprensión intuitiva de estos textos como de otros para añadir contexto; uno puede hacer una conjetura educada sobre lo que una vez se escribió en base a lo que ha sobrevivido en otros lugares. Pero es un trabajo laborioso y difícil, por eso se lo damos a los estudiantes de posgrado, los pobres.

Llegar a su rescate es un nuevo sistema creado por los investigadores de DeepMind que llaman Pythia, en honor al oráculo de Delfos que tradujo la palabra divina de Apolo en beneficio de los mortales.

El equipo primero creó una tubería “no trivial” para convertir la colección digital más grande del mundo de inscripciones griegas antiguas en texto que un sistema de aprendizaje automático pudiera entender. A partir de ahí, solo fue cuestión de crear un algoritmo que adivine con precisión secuencias de letras, tal como lo hizo con la araña y la mosca.

Los estudiantes de doctorado y Pythia recibieron textos reales con porciones extirpadas artificialmente. Los estudiantes completaron el texto con una precisión de alrededor del 43 por ciento, no tan bueno, pero este es un trabajo difícil y normalmente no se evaluaría de esta manera. Pero Pythia logró aproximadamente un 70 por ciento de precisión, considerablemente mejor que los estudiantes, y lo que es más, la interpretación correcta estuvo entre las 20 sugerencias principales el 73 por ciento de las veces.

(Actualizar: El párrafo anterior originalmente expresó incorrectamente la precisión probada; Leí mal la tasa de error como la tasa de precisión, esencialmente invirtiendo los resultados. Totalmente mi error. Agradezco a Yannis Assael de DeepMind por alertarme sobre esto y me disculpo con sus coautores por decir básicamente que Pythia era menos de la mitad de buena de lo que es).

El sistema no es lo suficientemente bueno para hacer este trabajo por sí solo, pero no es necesario. Se basa en los esfuerzos de los humanos (¿de qué otra manera podría ser entrenado en lo que hay en esos espacios?) y los aumentará, no los reemplazará. Y parece que a los estudiantes de posgrado les vendría bien una mano de todos modos.

Es posible que las sugerencias de Pythia no siempre sean exactamente acertadas, pero podrían ayudar fácilmente a alguien que lucha con una laguna complicada al brindarles algunas opciones para trabajar. Quitar un poco de la carga cognitiva de estas personas puede conducir a un aumento en la velocidad y la precisión al asumir los textos restantes sin restaurar.

El proyecto fue un esfuerzo conjunto entre la Universidad de Oxford y DeepMind, por Assael, Thea Sommerschield y Jonathan Prag. Su artículo sobre Pythia es disponible para leer aquíy parte del software que desarrollaron para crearlo está en este repositorio de GitHub.


Source link