Importer

Outil d'importation des entités historiques dans la base de données histHub (avec possibilité de synchronisation ultérieure).

L’importation de notices d’autorité est effectuée en deux étapes successives: l’importation initiale et les importations ultérieures (synchronisation des données), avec la possibilité de modifier ou d’effacer des données plus anciennes. Le paragraphe suivant donne la marche à suivre pour l’importation initiale (la synchronisation des données se fait de la même manière). Selon le type et la quantité des données, il est également possible de développer des procédés d’importation sur mesure.

Importation initiale

L’importation de notices d’autorité se fait en trois étapes:

  • Load: vos données sont intégrées dans l’ontologie de histHub (Link). L’importation se fait grâce à des fichiers TSV (tab-separated values, fichiers textes séparés par des tabulations à la Excel) et un fichier de configuration qui détaille la correspondance (mapping) entre vos données et l’ontologie de histHub.
  • Link: lors de la mise en relation (linking), le système recherche des correspondances entre vos données et les notices d’autorité disponibles dans histHub. Il vérifie si une entité, une personne par exemple, existe déjà dans la base de données et crée automatiquement un lien (grâce aux procédés de l’apprentissage automatique). Lorsque ce n’est pas le cas, vous pouvez déterminer manuellement, avec l’aide de histHub, s’il existe une correspondance ou non. Si la mise en relation a déjà été effectuée via Metagrid par exemple, les liens seront vérifiés lors de cette étape.
  • Write: les nouvelles entités reçoivent un identifiant histHub permanent (histHub-ID). Les entités déjà existantes sont enrichies par les données importées (par exemple, des lieux d’activité supplémentaires pour une personne).

Les trois étapes sont décrites dans le graphique ci-dessous: