Vernetzte und normierte Daten für die historischen Wissenschaften

histHub entwickelt eine Plattform für vernetzte und normierte Daten für die historischen Wissenschaften in der Schweiz. Über die Plattform lassen sich zahlreiche herausragende Datenbestände zur Schweizer Geschichte durchsuchen. histHub bindet die historischen Daten in die Workflows (Recherche, Datenbearbeitung und -produktion, Auswertung) der interessierten Zielgruppen ein und wird dadurch zu einer Anlaufstelle für die Forschungscommunity der digitalen Geisteswissenschaften. Vernetzen Verschiedene Datenbestände zur Schweizergeschichte durchsuchen? Vergleichen, was in welcher Datenbank über eine historische Person steht? histHub vernetzt historische Datenbestände für die Forschung […]

Workshop Personen: Ontologie, Datenmodell und Vernetzung

Kaum ein Forschungsprojekt oder eine Datenbank im Bereich der historischen Wissenschaften kommt ohne Daten zu Personen aus. Personendaten, so lässt sich daraus ableiten, sind für die meisten Projekte von zentraler Bedeutung. Die Interoperabilität von Personendaten zu verbessern ist deshalb eines der Hauptziele des Kooperationsprojektes histHub. histHub verfolgt dabei zwei Strategien: Das Vernetzen durch Tools sowie das Normieren mittels semantischer Datenmodelle. Im Workshop bietet histHub einen Einblick in den «work in progress» zu Personendaten. histHub präsentiert ein ontologisches Datenmodell und stellt […]

Bericht: Konstituierende Sitzung des Ausschusses Interoperabilität, 8. Mai 2018

Wie ergänzen die Vernetzungsdienstleistungen und Normdaten von histHub die Angebote bereits bestehender Institutionen?  Um diese Frage zu diskutieren, fand in den Räumen des Historischen Lexikons der Schweiz am 8. Mai 2018 die konstituierende Sitzung des Ausschusses Interoperabilität statt. Der Ausschuss setzt sich aus Vertreterinnen und Vertretern des Schweizerischen Bundesarchivs, der Schweizerischen Nationalbibliothek, dem Data Life-Cycle Management Project, der Nationalen Infrastruktur für Editionen (NIE-INE) und dem Data and Service Center for the Humanities (DaSCH) zusammen.  Nach einer Begrüssung durch die Projektleiterin Dr. Pascale Sutter gab der Geschäftsführer Dr. Alban Frei eine kurze Einführung in das Projekt histHub und stellte den Teilnehmenden […]

Zeilen und Einträge – Rows und Records

histHub befasst sich in einer Blogserie mit der Aufbereitung und Anreicherung von Daten in OpenRefine. Alle Beiträge der Serie werden in einer Übersicht gesammelt. In diesem Beitrag zeigen wir den Unterschied zwischen Row- und Record-Mode.  Oben links im OpenRefine Bearbeitungsfenster kann gewählt werden, ob die Daten das «row» oder als «record» angezeigt werden.   Unterschied zwischen row und record  Eine «row» ist eine einzelne Zeile in OpenRefine. Sie enthält Daten zu einem bestimmten Objekt. Im Idealfall enthält sie zu Beginn eine […]

Bericht: Workshop Ortstypologie und Ortsontologie

Wie lässt sich ein Normdatensatz über historische Ortsdaten organisieren, der einfach zu implementieren und gleichzeitig in der Lage ist, die Feinheiten historischer Unterschiede abzubilden? Um diese Frage zu diskutieren, lud histHub am 26. März 2018 im Haus der Akademien in Bern zum ersten öffentlichen Workshop ein. Nach der Begrüssung durch Markus Zürcher, Generalsekretär der Schweizerischen Akademie für Geistes- und Sozialwissenschaften, und einer Einführung von Alban Frei, Geschäftsführer von histHub, führte Manuela Weibel, Computerlinguistin beim Schweizerischen Idiotikon, durch den inhaltlichen Teil […]

Bericht: Konferenz «Digital Humanities in the Nordic Countries»

An der Konferenz «Digital Humanities in the Nordic Countries» vom 7.-9. März in Helsinki war auch histHub vertreten: Manuela Weibel und Tobias Roth vom Schweizerischen Idiotikon haben in ihrem Referat (samt zugehörigem Paper «On Modelling a Typology of Geographic Places for the Collaborative Open Data Platform histHub») histHub und die darin entstehende Ortstypologie vorgestellt. Die Rückmeldungen darauf waren durchwegs positiv. Das Referat war in der Session zu «Places» angesiedelt, wo sich schnell gezeigt hat, dass sich Forschende in Skandinavien mit […]

Bericht: Workshop «Linked Data im Archiv zwischen Theorie und praktischer Anwendung»

Am 21. Februar 2018 fand im Schweizerischen Bundesarchiv in Bern mit einem interessierten Publikum aus der Archiv- und Bibliothekswelt der Workshop «Linked Data im Archiv zwischen Theorie und praktischer Anwendung» statt. Die aktive Arbeitsgruppe Normen und Standards des VSA, präsidiert von Michele Merzaghi, BAR, hatte ihn organisiert. Als erstes sprach Alain Dubois, Staatsarchiv Wallis, zu «Le Linked Data – une (r)évolution pour les services d’archives ?» und betonte, wie wichtig das Matterhorn RDF Data Model (W3C) und die Referenzierung auf […]

Ergänzen eines OpenRefine Projekts mit einem anderen

histHub befasst sich in einer Blogserie mit der Aufbereitung und Anreicherung von Daten in OpenRefine. Alle Beiträge der Serie werden in einer Übersicht gesammelt. In diesem Beitrag befassen wir uns mit dem Zusammenfügen von Inhalten aus verschiedenen Tabellen. Dabei greifen wir auf das im letzten Beitrag erstellte Projekt zurück. Tabellen mit abgleichbaren Spalten Für das Ergänzen eines OpenRefine Projekts mit Inhalten aus einem anderen Projekt braucht es eine Spalte mit Identifikatoren, die abgeglichen werden können. Das heisst, in beiden Projekten […]

OpenRefine Projekt von Website erstellen

histHub befasst sich in einer Blogserie mit der Aufbereitung und Anreicherung von Daten in OpenRefine. Alle Beiträge der Serie werden in einer Übersicht gesammelt. In diesem Beitrag zeigen wir, wie ein neues Projekt aus einer Website erstellt werden kann. Als Beispiel verwenden wir dazu die Wikipedia-Seite mit den Bevölkerungszahlen von 1939 nach Ländern. Projekt erstellen von Clipboard OpenRefine bietet beim Erstellen eines neues Projekts die Option «Web Addresses (URLs)». Diese eignet sich für strukturierte Daten, die bei der Wikipedia-Seite nicht […]

Ontologien und Datenmodelle

Während menschliche Nutzer durch ihr Welt- und Kontextwissen die Bedeutung von Daten und deren Zusammenhang selbst aus einer unstrukturierten Datenmenge meist noch erschliessen können, gelingen solche Kontextualisierungsleistungen Maschinen prinzipiell weniger gut. Die unter dem Stichwort des «semantic web» zusammengefassten Bemühungen begegnen dieser Schwierigkeit dadurch, dass sie nicht nur die Daten selbst (in einer allenfalls flachen Struktur) speichern, sondern vielmehr auch deren Bedeutung und das semantische Geflecht, in dem sie stehen, offenlegen und dem Datenmodell mit einzubeschreiben versuchen. In den weiteren […]

Usecase: Reconciling von Geodaten

HistHub befasst sich in einer Blogserie mit der Aufbereitung und Anreicherung von Daten in Openrefine. Der heutige Beitrag widmet sich einem konkreten Anwendungsfall. Im Folgenden werden wir beschreiben, wie wir für die Vernetzung der Geodaten verschiedener Provider vorgegangen sind. Probleme Bei einem grossen, heterogenen Datensatz, in unserem Beispiel ist das eine Liste von geografischen Bezeichnungen, bestehend aus Ländern und Orten, aber auch Gebirgen oder Gewässern, ergeben sich bei der Reconciliation mit Wikidata zwei Probleme: Die Daten mit einem spezifischen Wikidata […]