Aufbereitung der Forschungsdaten der SSRQ für histHub

Projekte und Forschende, die über Forschungsdaten zu historischen Personen, Orten, Organisationen oder Konzepten verfügen, können diese in histHub mit den Daten verwandter Projekte verlinken und mit Normdaten anreichern. Die fünf Träger von histHub erarbeiten anhand ihrer Daten einen Normdatensatz sowie mehrere kontrollierte Vokabulare zur Schweizer Geschichte.

Die Daten aus den zwei XML-Datenbanken zu historischen Ortsnamen bzw. zu historischen Begriffen (Schlagwörter und Lemmata) sowie aus dem RDFTriplestore zu historischen Personen und Organisationen der Sammlung Schweizerischer Rechtsquellen (SSRQ) wurden für den histHub-Normdatensatz nach den folgenden Schritten aufbereitet.

Als erstes beschrieben die Entwickler Bernhard Ruef und Natalia Korchagina die drei Datenbanken und deren Daten eingehend. Gonzalo García Lara, der für das Back-End der histHub-Datenbank zuständig ist, analysierte die Datenstruktur mit Hilfe der Dokumentation. Danach zeichnete er ein erstes generisches Datenmodell mit dem Unified-Modeling-Language (UML)-Editor plantUML. Dieses Open-Source-Tool hat sich im Vergleich zur Konkurrenz (UML Designer, Papyrus und yUML) als praktischstes Tool zur Erstellung von Klassendiagrammen erwiesen. Es verfügt über eine einfache Syntax, das Umsetzen geht schnell mit Hilfe der Anleitung und die Kontrolle über das Erscheinungsbild, d. h. Farben und Formen von Kästchen etc., ist gewährleistet.

Physisches Datenmodell V5 (Gonzalo García Lara)

Das relationale Datenmodell wurde in mehreren Schritten nach eingehenden Diskussionen im gesamten Team überarbeitet und verfeinert. Es liegt nun in einer vorläufigen 5. Version als UML-Grafik sowie in Form von Tabellen, Attributen und Beziehungen inkl. Beschreibungen vor und beinhaltet alle Informationen über Personen, Organisationen, Orte, Schlagworte und Lemmata der drei Datenbanken der SSRQ. Die Umsetzung des generischen Modells erfolgte mit der frei verfügbaren relationalen Datenbank PostgreSQL.

Die Forschungsdaten aus den SSRQ-Datenbanken können dank der grafischen Oberfläche bzw. dem GUI, das Marc Zobrist mit dem quelloffenen Webframework Django programmierte, gesucht, angezeigt, editiert und gelöscht werden. Die Suche mit automatischer Ergänzung nach Personen, Organisationen, Orten oder Begriffen ergibt die gewünschte Trefferlisten, in der man mit einem Klick auf einen Eintrag die mit dem Eintrag verbundenen Attribute anzeigen lassen kann. Auch die Aufnahme von neuen Entitäten oder die Mutation von bestehenden Daten ist möglich. Der Import der Inhalte der SSRQ-Datenbanken hatte zur Folge, dass bisher unbekannte Inkonsistenzen aufgedeckt und korrigiert werden konnten.

Suchresultat für die Suche nach «Rapperswil Burg» (Marc Zobrist)

Die Datenbereinigung ist in vollem Gange, damit aus der Fülle von Forschungsdaten der Normdatensatz zu Personen, welche bereits via Metagrid multilateral verlinkt sind und deren Vornamen im Vornamen-Vokabular publiziert sind, generiert werden kann.