Répositoire du mémoire et du livrable produits par Esteban Sánchez Oeconomo lors du stage TNAH 2022 au sein du projet Artl@s
Esteban Sánchez Oeconomo, Du catalogue papier au tableur numérique. Un pipeline semi-automatique pour former des étudiants en sciences humaines aux humanités numériques, mémoire de master « Technologies numériques appliquées à l’histoire », dir. Béatrice Joyeux-Prunel et Simon Gabay, École nationale des chartes, 2022.
Le présent mémoire établi le bilan d'un stage effectué pendant l'été 2022 à l'Université de Genève, sous la direction de Béatrice Joyeux-Prunel et de Simon Gabay. Financée par l'École normale supérieure et par le centre IMAGO, cette mission s'est déroulée au sein du projet Artl@s, qui vise à cartographier les circulations artistiques mondiales des XIXe et XXe siècles.
Ce travail présente une chaîne de traitement semi-automatique pour extraire des données contenues dans des catalogues d'expositions d'art du XIXe et XXe siècles. Il s'intéresse à ses enjeux scientifiques, pédagogiques et plus largement techniques. Il propose de positionner la mission dans un processus dilaté sur trois stages effectués depuis 2019, en prenant soin de comprendre les continuités et les ruptures qui ont mené à définir une direction résolument tournée vers l'accessibilité de l'outil.
Le pipeline développé vise à produire efficacement des données pour la recherche, mais sa vocation fondamentale est pédagogique : l'outil a été conçu pour introduire des étudiants en sciences humaines aux principaux outils des humanités numériques. Ce mémoire suggère que le livrable développé mène, pour la première fois, à remplir un objectif défini depuis le début des stages : permettre aux collaborateurs du projet de produire des données satisfaisantes à partir d'un programme simple et solide qui leur transmette les notions techniques fondamentales des humanités numériques.
Ce répositoire contient les éléments suivants :
- Mémoire en format
.pdf
/script_extractionCatalogs
: dossier contenant le livrable, avec des instructions dans un README dédié/memoire_LatEx
: dossier contenant les fichiers LatEx du mémoire