Descubrimientos arqueológicos

Inteligencia artificial al servicio de la reconstrucción de textos babilónicos

Cuando la inteligencia artificial (IA) permite redescubrir antiguos tesoros históricos. Los investigadores israelíes pudieron reconstruir los escritos babilónicos marcados en tablillas de arcilla utilizando un modelo de aprendizaje profundo.

Inteligencia artificial al servicio de la reconstrucción de textos babilónicos

Reconstruir escritos ilegibles en tablillas de arcilla ahora es posible gracias al "aprendizaje profundo", esta rama de la inteligencia artificial.

En Mesopotamia se han encontrado cientos de miles de tablillas de arcilla. Esto no significa que sus textos grabados sean accesibles para nosotros:muchas de las inscripciones han sido dañadas a lo largo de los siglos, dejándolas ilegibles... hasta hoy. En un estudio publicado el 1 st Septiembre de 2020 en PNAS, científicos especializados en IA y arqueología explican cómo lograron desenterrar textos administrativos escritos en cuneiforme acadio durante la civilización babilónica del Imperio aqueménida (539 a 331 a. C.).

Un pasado redescubierto poco a poco

La identificación de palabras ilegibles fue posible gracias a la inteligencia artificial, específicamente una de sus formas, el aprendizaje profundo (ver más abajo), a través de una red neuronal artificial recurrente (RNN). Este modelo ya ha sido probado en la traducción automática de textos:procede estudiando las frases de un corpus de textos para descifrar sus sutilezas; a través de la repetición, la red perfeccionará su comprensión de la estructura y el significado de este corpus para adivinar las palabras que faltan en los escritos originales.

El "aprendizaje profundo" o "aprendizaje profundo" es un proceso derivado de la inteligencia artificial:implica hacer que el software funcione aprendiendo, como lo harían las neuronas del cerebro humano, a partir de formas y objetos ya encontrados.

La elección de los textos administrativos no es casualidad:estos documentos tienen una estructura rigurosa y similar, lo que los hace más fácilmente analizables por el modelo de aprendizaje profundo. Así, mediante el modelo de aprendizaje profundo se analizó un corpus compuesto por 1.400 textos "transliterados", es decir transpuestos de la versión original en cuneiforme a la versión traducida al alfabeto latino.

Durante el estudio, el modelo fue probado en particular con 52 preguntas de opción múltiple, que los científicos habían extraído de los textos de las tabletas. En cada ocasión, el objetivo de la IA era encontrar la palabra que faltaba de las 52 frases entre cuatro opciones. Tomó la decisión correcta el 88,5% de las veces. Los investigadores consideran que su "modelo fue, como se esperaba, bueno para reconocer la estructura de las oraciones" . Más sorprendentemente, también lo fue "en la detección del significado de las oraciones" , podemos leer en el estudio.

Un ahorro de tiempo

Si bien los modelos de aprendizaje profundo funcionan bien para las escrituras latinas actuales, no ocurre lo mismo con las escrituras con formas más complejas, como el árabe, o aquellas con pocos registros digitales disponibles, como el acadio. Para los investigadores, las bases de datos enriquecidas permitirán en el futuro completar textos de diferentes géneros literarios más complejos, como la ciencia o la literatura.

La RNN podría facilitar el trabajo de historiadores, investigadores o estudiantes sobre el Imperio aqueménida. Este es el objetivo que se plantean los autores al integrar su modelo en Atrahasis , una útil herramienta digital para la restauración de textos cuneiformes deteriorados.