Quando si importano voci di autorità, è necessario distinguere tra due tappe: l’importazione iniziale e le importazioni successive (sincronizzazione dei dati), che permettono di modificare o cancellare dati precedentemente importati. Qui di seguito è descritta l’importazione iniziale, la sincronizzazione di dati avviene in modo analogo. A seconda del tipo e della quantità di dati da trattare, è tuttavia possibile stabilire procedimenti su misura con il fornitore di dati.
Importazione iniziale
L’importazione iniziale delle voci di autorità avviene in tre passaggi:
- Load: con il supporto di histHub, i dati del fornitore vengono integrati nell’ontologia di histHub (link). L’importazione si fa tramite file TSV (tab-separated values, ossia documenti tabulari del genere Excel) e un file di configurazione che specifica la mappatura (mapping) tra i dati e l’ontologia di histHub.
- Link: nella messa in relazione (linking) vengono cercate delle concordanze tra i dati da importare e le voci d’autorità presenti nel database di histHub. Il sistema verifica se un’entità da importare, ad esempio una persona, esiste già nel database di histHub e, grazie al metodo dell’apprendimento automatico, crea automaticamente un link. Se ciò non succede, il fornitore deve determinare manualmente, con il supporto di histHub, se esiste una concordanza. Se la connessione è già stata effettuata via Metagrid, i link verranno controllati in questo passaggio.
- Write: le nuove entità riceveranno un identificatore histHub persistente (histHub-ID). Le entità esistenti sono arricchite con i dati importati, ad esempio ulteriori luoghi di attività di una persona.
I tre passaggi sono illustrati nel grafico seguente: