Como si ser un erudito en griego antiguo no fuera lo suficientemente difícil fundamentalmente, los textos principales en los que se basan con frecuencia están dañados sin posibilidad de reparación, ya que tienen miles de años. Los historiadores pueden tener una nueva y poderosa herramienta en Ítaca, un modelo de aprendizaje automático creado por DeepMind que hace conjeturas sorprendentemente precisas sobre las palabras que faltan y la ubicación y fecha del texto. Es una aplicación inusual de IA, pero que demuestra cuán útil puede ser fuera del mundo tecnológico.
El problema de los textos antiguos incompletos atraviesa muchas disciplinas en las que los expertos trabajan con materiales degradados. El documento original podría estar hecho de piedra, arcilla o papiro, escrito en acadio, griego antiguo o lineal A, y describir cualquier cosa, desde la factura de un tendero hasta el viaje de un héroe. Sin embargo, lo que todos tienen en común es el daño acumulado durante miles de años.
Los espacios en los que el texto está gastado o arrancado a menudo se denominan lagunas y pueden ser tan cortos como una letra que falta o tan largos como un capítulo o, de hecho, una historia completa. Completarlos puede ser trivial o imposible, pero debe comenzar en alguna parte, y ahí es donde Ithaca debe ayudar.
Entrenada en una enorme biblioteca de textos griegos antiguos, Ítaca (llamada así por la isla natal de Odiseo) no solo puede decir qué palabra o frase faltante es probable que sea, sino que también puede determinar qué edad tiene y dónde fue escrita. No va a completar un ciclo épico completo por sí solo: está destinado a ser una herramienta para quienes trabajan con estos textos, no una solución.
Un artículo publicado en la revista Nature demuestra su eficacia, utilizando como ejemplo algunos decretos de la Atenas de Pericles. Se cree que se escribieron alrededor del 445 a. C., Ithaca sugirió, según su análisis textual, que en realidad databan del 420 a. C. más o menos, de acuerdo con evidencia más reciente. Puede que no parezca mucho, pero ¡imagínese si la Declaración de Derechos se escribiera 20 años después!
Créditos de imagen: Mente profunda
En cuanto al texto en sí, los expertos del estudio acertaron en un 25 % en la primera pasada; no es exactamente estelar, aunque, por supuesto, la restauración de texto no pretende ser una diversión vespertina sino un proyecto a largo plazo. Sin embargo, junto con Ithaca, lograron rápidamente un 72 % de precisión. A menudo se encuentra que este es el caso en otras situaciones en las que los humanos finalmente son más precisos pero pueden acelerar su proceso eliminando rápidamente los callejones sin salida o sugiriendo un punto de partida. En los datos médicos, puede ser fácil supervisar una anomalía que la IA podría señalar rápidamente, pero, en última instancia, es la experiencia humana la que percibe los detalles y encuentra la respuesta correcta.
Puedes probar un versión reducida de Ítaca aquí, si tiene a mano algún texto griego antiguo lleno de lagunas, o use uno de los ejemplos provistos para ver cómo llena los espacios solicitados. Para piezas más largas o que falten más de 10 letras, pruébelo en este cuaderno de colaboración. El código está disponible en esta página de GitHub.
Aunque el griego antiguo es un área obvia y fructífera en la que Ithaca debe comenzar, el equipo ya está trabajando duro en otros idiomas también. El acadio, el demótico, el hebreo y el maya están todos en la lista y, con suerte, se agregarán más con el tiempo.
“Ithaca ilustra la contribución potencial del procesamiento del lenguaje natural y el aprendizaje automático en las humanidades”, dijo Ion Androutsopoulos, profesor de la Universidad de Atenas que trabajó en el proyecto. “Necesitamos más proyectos como Ithaca para mostrar aún más este potencial, pero también cursos y material didáctico adecuados para educar a futuros investigadores que tendrán una mejor comprensión conjunta de las humanidades y los métodos de IA”.
Source link