A principios de este verano, el financiador científico NWO concedió 12 millones de euros al proyecto CLARIAH, que permitirá a los científicos humanistas holandeses construir una "infraestructura digital". ¿Para qué sirve y cuál es el beneficio? Lo explica Henk Wals, director del Instituto Internacional de Historia Social (IISH) y uno de los iniciadores del proyecto.
Grandes datos lo es completamente hoy en día. Incluso en campos de la ciencia que tradicionalmente hacen poco con el análisis de datos, como las humanidades. Sin embargo, pronto historiadores, investigadores de medios y lingüistas trabajarán en ello gracias al gran proyecto Common Lab Research Infrastructure for the Arts and Humanities (CLARIAH). El proyecto forma parte de una auténtica 'revolución' que se está produciendo en las humanidades en los últimos años.
Los estudiosos de humanidades trabajan con documentos de archivos, pero también con textos, imágenes y sonidos de los medios de comunicación. Cada vez es posible digitalizar más fuentes de este tipo. La ventaja de las fuentes digitalizadas es que puedes buscarlas con programas informáticos especiales. Una computadora puede escanear registros históricos digitales a la velocidad del rayo en busca de palabras específicas, combinaciones de palabras o cambios en las palabras. Al comparar y combinar el contenido de todo tipo de fuentes digitales, se pueden sacar conclusiones que están mucho más allá del alcance del investigador de archivos tradicional y solitario.
Pero antes de que todo eso suceda, es necesario hacer algunas cosas herramientas y ya se han puesto a disposición 12 millones de euros para este fin. "Una infraestructura digital", como la llama el director Henk Wals del Instituto Internacional de Historia Social (IISH) de Ámsterdam.
12 millones es mucho dinero. ¿Para qué se necesita eso exactamente? “En este momento se está produciendo una revolución en las humanidades. Una revolución digital, especialmente en el campo de los métodos de investigación disponibles. Esa revolución se viene produciendo desde hace algún tiempo en algunas zonas. Pero en los últimos años, debido a que cada vez se digitaliza más material y también porque la informática puede hacer cosas cada vez más interesantes para los científicos de humanidades, se ha visto que esta revolución realmente está tomando forma. Pero todos esos datos y las herramientas necesarias para analizarlos se encuentran en todo tipo de lugares diferentes. Por eso se necesita una especie de 'infraestructura digital' para reunir todas esas herramientas y datos”.
¿Entonces esa infraestructura se compone principalmente de programas informáticos para analizar datos? "Entre otras cosas. Básicamente, lo que hacemos es reunir los datos y las herramientas de análisis. Las herramientas deben estar estructuradas de tal manera que puedan manejar tantos tipos de datos como sea posible. Y los datos, a su vez, deben estandarizarse de tal manera de manera que tantas herramientas como sea posible puedan trabajar con él. Por lo tanto, se trata de datos y herramientas de análisis que pueden comunicarse entre sí de manera digital”.
“Cuando hablamos de datos, nos referimos a tres tipos de datos:en primer lugar, los datos estructurados que se almacenan en diferentes bases de datos. Recientemente, ha habido una cantidad cada vez mayor de datos no estructurados. Se trata de grandes cantidades de textos de archivos digitalizados pero no estructurados. Se trata esto de forma diferente que con los datos estructurados. Finalmente, tienes cosas como películas, imágenes y audio. Lo afrontas de manera diferente”.
Realmente grandes datos Entonces. ¿Eso va más allá del trabajo artesanal antiguo? "Para dar un ejemplo:en el IISH tenemos el archivo del sindicato FNV. Son kilómetros de papel. Ahora se está digitalizando poco a poco. Por ejemplo, si quiero saber cómo ha reaccionado ese sindicato a la globalización en los últimos años, décadas, tendría que revisar todos esos documentos, folletos y actas. Ahora estamos en la etapa en la que podemos crear un conjunto de datos que pueda enumerar todos aquellos documentos que son relevantes para dicha pregunta de investigación en orden de relevancia”. P>
“Eso no significa que toda la investigación se realice de inmediato, pero sí que se pueden recopilar datos mucho más rápido. Si también puedes configurar herramientas de visualización que puedan generar gráficos y redes de mapas, te ayudará mucho como académico de humanidades a lograr nuevos conocimientos”.
Una encuesta en De Groene Amsterdammer mostró que muchos académicos de humanidades humanidades digitales encontrar el desarrollo más importante en su campo. ¿Están agotados los métodos de investigación tradicionales? “No se debe ver esta revolución digital como la sustitución de un método por otro. Los métodos tradicionales (interpretación, historias bien escritas) persisten, pero pueden respaldarse con nuevos métodos de investigación. Esto permite sacar conclusiones nuevas, pero también, sobre todo, más fundamentadas. Y también es una especie de aumento de la eficiencia, porque se puede leer e investigar mucho más al mismo tiempo de lo que es posible como científico individual. Si tiene una máquina que lee documentos por usted y saca conclusiones preliminares de ellos, entonces se aplica lo siguiente:el cielo es el límite .”
Por lo tanto, se trata principalmente de responder a las grandes y amplias preguntas de investigación... “Sí, cuestiones que requieren el análisis de una enorme cantidad de material. Otro ejemplo es lo que hicimos en el Instituto Huygens, donde yo trabajaba. Allí teníamos un proyecto sobre el desarrollo del conocimiento en el siglo XVII. Allí habíamos digitalizado miles de cartas de eruditos del siglo XVII. Luego quisimos saber dónde aparecieron por primera vez ciertos conocimientos nuevos en semejante grupo de académicos. ¿Dónde y cómo se discutieron los nuevos conocimientos y cómo pasaron de un académico a otro?”
“Para eso se necesitan herramientas muy avanzadas que puedan analizar documentos en los diferentes idiomas europeos de esa época. Y herramientas de visualización que luego pueden mapear redes de correspondencia. De esta manera, como científico de humanidades, podrá sacar conclusiones mucho más firmes. En lugar de examinar la correspondencia de uno de esos científicos del siglo XVII, se pueden investigar muchos al mismo tiempo. Entonces tus conclusiones estarán más en la dirección de la ciencia:serán mucho más duras y mejor fundamentadas”.
¿Es eso necesario, entonces, para atraer más a las humanidades hacia la versión beta? Los académicos de humanidades estarían preocupados por la interpretación, no por la investigación cuantitativa... “No estoy diciendo que las humanidades deban parecerse más a las ciencias, sino que esto es un acuerdo. Lo que también acabo de decir, con los ejemplos sobre el FNV y los científicos del siglo XVII, es que se recopilan muchos datos y se sacan conclusiones basadas en ellos. Pero al final seguimos siendo estudiosos de humanidades que interpretamos y escribimos hermosas historias. Esa historia se fundamenta mejor de esta manera”.
“Creo que es sorprendente que ahora parezca haber una especie de batalla de direcciones dentro de las humanidades. Con científicos, por un lado, que apoyan estos nuevos métodos y, por otro, personas a las que no les gusta nada, porque piensan que la digitalización no conviene a las humanidades. Pero la digitalización es algo que además de Los métodos tradicionales existirán. Es una manera de fundamentar mejor tus conclusiones”.