Vernetzte und normierte Daten für die historischen Wissenschaften

histHub entwickelt eine Plattform für vernetzte und normierte Daten für die historischen Wissenschaften in der Schweiz. Über die Plattform lassen sich zahlreiche herausragende Datenbestände zur Schweizer Geschichte durchsuchen. histHub bindet die historischen Daten in die Workflows (Recherche, Datenbearbeitung und -produktion, Auswertung) der interessierten Zielgruppen ein und wird dadurch zu einer Anlaufstelle für die Forschungscommunity der digitalen Geisteswissenschaften.

Vernetzen

Verschiedene Datenbestände zur Schweizergeschichte durchsuchen? Vergleichen, was in welcher Datenbank über eine historische Person steht?
histHub vernetzt historische Datenbestände für die Forschung und die interessierte Öffentlichkeit.
histHub entwickelt und vertreibt auf die Bedürfnisse der Community zugeschnittene Vernetzungstools, die flexibel genutzt und weiterentwickelt werden können. Auf diese Weise wird die nationale und internationale Vernetzung von historischen Daten gefördert und vereinfacht.

Normieren

Burg, Schloss, veste, castrum oder hus? Henker, meyster, tiller oder doch Scharfrichter? Historische Begriffe verändern sich nicht nur über den Lauf der Zeit, sondern variieren auch geografisch.
Die Normdaten von histHub schaffen Klarheit und verweisen auf die historischen Quellen.
histHub modelliert und verwaltet einen Normdatensatz zur Schweizer Geschichte. Durch den Einsatz semantischer Datenmodellierung ist der histHub-Normdatensatz sowohl einfach adaptierbar als auch in der Lage, feinste historische Unterschiede abzubilden. Mit den histHub-Normdaten sind eindeutige Aussagen über Personen, Orte, Organisationen und Konzepte über Epochen- und Sprachgrenzen hinweg möglich.

Mitmachen

histHub befindet sich im Aufbau und hat eine offene Projektanlage. Bis Ende 2019 soll histHub zu einer Produktions- und Forschungsumgebung der historischen Wissenschaften in der Schweiz werden. histHub entwickelt Nutzerschnittstellen, die es künftigen Partnern ermöglicht, ihre Daten in histHub einzuspeisen, anzulegen, anzureichern und zu vernetzen.
-> Kontaktaufnahme

Bearbeiten von Spalten und Zellen

openrefineHistHub befasst sich in einer Blogserie mit der Aufbereitung und Anreicherung von Daten in Openrefine. Dieser Beitrag zeigt häufig angewandte Transformationen.

Als Grundlage dienen weiterhin die Metadaten zu den Fotografien von Annemarie Schwarzenbach, die im Beitrag über das Erstellen eines OpenRefine Projekts vorgestellt wurden.

Häufige Transformationen

Die Spalte «Titel_Name» enthält Informationen über die Fotografie, die meist aus einem Land, einem Ortsnamen und einer genaueren Bezeichnung bestehen. Diese wollen wir extrahieren. Es gibt in der Tabelle zwar eine Spalte «Ort», mit einer Facette lässt sich aber schnell herausfinden, dass diese nur Orte in der Schweiz enthält. Um eine Spalte mit Ortsangaben weltweit zu erstellen, wollen wir aus der Spalte «Titel_Name» Ortsangaben extrahieren. Davor putzen wir die Einträge.

Whitespace entfernen

Ein häufiges Phänomen sind überzählige Leerzeichen am Anfang oder Ende einer Zelle. OpenRefine stellt eine Funktion zur Verfügung, die mit einem Klick solche Zeichen entfernt. Über das Spaltenmenü -> «Edit cells» -> «Common transforms» -> «Trim leading and trailing whitespace» wird diese aufgerufen. In diesem Beispiel gibt es keine Leerzeichen am Anfang oder Ende eines Eintrags, OpenRefine bearbeitet also 0 Zeilen.

Auch die Funktion «Collapse consecutive whitespace» sollte vor weiteren Transformationen ausgeführt werden. Mit dieser Funktion werden 10 Zeilen bearbeitet, in denen es offenbar aufeinander folgende Leerzeichen gab.

Spalten trennen

Die meisten Einträge in der Spalte «Titel_Name» sind so aufgebaut, dass zuerst das Land, nach einem Komma die Ortschaft und danach eine genauere Bezeichnung für das Bild angegeben ist.

OpenRefine

Dies machen wir uns zunutze.

Über das Menü der Spalte «Titel_Name» wird «Edit column» -> «Split into several columns…» aufgerufen.

Darauf können die Parameter der Trennung der Spalte eingestellt werden. Zuerst trennen wir die genauere Bezeichnung hinter der Ortsbezeichnung ab.

OpenRefine bietet zwei Möglichkeit zur Trennung von Spalten an:

  • Bei einem bestimmten Trennzeichen, oder
  • bei einer bestimmten Anzahl von Zeichen.

Für unser Problem bietet sich einer Trennung nach dem «: » an. Der Leerschlag ist notwendig, sonst beginnt die zweite Spalte mit einem solchen. Reguläre Ausdrücke sind möglich. Eine Einführung inklusive Übungen  zu Regulären Ausdrücken bietet der Regexr. In OpenRefine kann bei der Trennung von Spalten eine maximale Anzahl neu zu bildender Spalten angegeben werden.

Rechts im Bearbeitungsfenster können weitere Optionen angewählt werden, die OpenRefine nach der Trennung der Spalten ausführt. «Guess cell type» bestimmt automatisch den Inhaltstyp der Zelle, also ob es sich um einen String (Text), eine Zahl oder ein Datum handelt. «Remove this column» entfernt die ursprüngliche Spalte. Diese Option soll jetzt nicht gewählt werden, wir wollen die ursprüngliche «Titel_Name» Spalte beibehalten.

Ein Klick auf «OK» trennt die Spalten. Neben der Spalte «Titel_Name» befinden sich jetzt die Spalte «Titel_Name 1» und die Spalte «Titel_Name 2» mit der genaueren Bezeichnung des Inhalts der Fotografie, und «Titel_Name 3».

Diese letzte Spalte wurde so nicht erwartet. Eine Facette zeigt, dass lediglich zwei Zeilen in dieser Spalte einen Inhalt haben.

OpenRefine Facet

Offensichtlich befand sich in diesen Zellen mehr als ein «: », so dass sie mehr als einmal geteilt wurden. Dies hätte sich mit einer «2» bei «Split into _ columns at most (leave blank for no limit)» verhindern lassen. Beheben lässt sich der Fehler, indem der letzte Schritt rückgängig gemacht (siehe unten) und mit dieser Einstellung nochmal wiederholt wird.

Die Spalte «Titel_Name 1» wird nun erneut aufgeteilt, diesmal beim «, ». Der Prozess ist derselbe wie vorhin. Diesmal setzen wir aber ein Häkchen bei «Remove this column», und legen die maximale Anzahl der Spalten auf 2 fest. Daraus entstehen die Spalten «Titel_Name 1 1» und «Titel_Name 1 2».

Umbenennen von Spalten

Diese Namen sind etwas unhandlich, wir werden deshalb sinnvollere Spaltenüberschriften vergeben.

Dies wird im Spaltenmenü unter «Edit column» -> «Rename this column» gemacht. Aussagekräftigere Titel sind z.B. «Land» für «Titel_Name 1 1», «Ort_weltweit» für «Titel_Name 1 2» und «Kurztitel» für «Titel_Name 2». Aus einer Spalte, die Ortsnamen und andere Inhalte enthielt, haben wir jetzt übersichtliche Informationen extrahiert.

OpenRefine lässt Leerzeichen in Spaltenüberschriften zu. Da andere Anwendungen damit Probleme haben ist es dennoch sinnvoll, von Anfang an auf Leerzeichen oder Sonderzeichen wie Umlaute zu verzichten.

Undo/Redo

Verschiedentlich wurde schon auf die Möglichkeit verwiesen, Arbeitsschritte rückgängig zu machen.

Schnell und einfach geht das mit der Tastenkombination Ctrl + Z. OpenRefine bietet aber mehr.

Im Tab «Undo/Redo» in der linken Seitenspalte können einzelne oder mehrere Schritte rückgängig gemacht oder wiederholt werden. Der aktuelle Stand des Schwarzenbach-Metadaten-Projekts sieht so aus:

Alle Arbeitsschritte sind aufgelistet, jeweils mit den umgesetzten Befehlen. Auch über das Menü ausgeführte Befehle sind hier als Text dargestellt.

Ein Klick auf einen Arbeitsschritt setzt das ganze Projekt wieder auf diesen Stand zurück.

Ausserdem kann der Code aller oder einiger der bisherigen Arbeitsschritte kopiert werden. Danach können sie in einem anderen oder auch im selben Projekt angewendet werden. Dazu auf «Extract» klicken. Hier können die gewünschten Arbeitsschritte ausgewählt werden.

Auf der rechten Seite wird das JSON angezeigt. Sind die gewünschten Arbeitsschritte ausgewählt, kann der Code mit Ctrl + A markiert und mit Ctrl + C kopiert werden.

Zur Übung kopieren wir den Code aller Arbeitsschritte. Dann setzen wir das Projekt im Tab Undo/Redo auf den Schritt 0 zurück, indem wir auf «0. Create Project» klicken. Danach «Apply» wählen, den zuvor kopierten Code mit Ctrl + V in das Textfeld einfügen, und mit «Perform Operations» anwenden. Das Projekt ist jetzt wieder auf dem gleichen Stand wie zuvor.

Auf diese Weise Arbeitsschritte zu kopieren funktioniert auch über Projekte hinweg, wenn die Spaltenüberschriften dieselben sind.

Fragen, Anregungen oder Wünsche nehmen wir gerne per Mail entgegen.

histHub-Ontologie

In histHub entstehen Normdaten zu den Hauptentitäten Personen, Orte, Organisationen und Konzepte sowie Thesauri zu verschiedenen Unterentitäten wie z. B. Vornamen (histHub-fornames), Orts- und Organisationstypen, Berufen etc. Thesauri sind standardisierte Vokabulare, die sowohl hierarchisch als auch in beliebigen Relationen strukturiert sind und das in einem Themengebiet gebrauchte Vokabular beschreiben und normieren.

histHub modelliert die Normdaten mit Hilfe einer Ontologie. Die histHub-Ontologie strukturiert Daten anhand eines eindeutig definierten und dokumentierten Datenmodells und bildet den historischen Diskurs über die Wirklichkeit in Daten ab. Die Ontologie ist flexibel und erweiterbar. Anhand der Ontologie werden Merkmale und Beziehungen von Entitäten – sei es abstrakt (Äquivalenz, Hierarchie etc.) oder konkret (in Raum und Zeit) – samt Metadaten zu ihrer Definition und Entstehung in Form von strukturierten Daten gesammelt. Die Informationen sind dadurch explizit (ohne verborgene Annahmen) und maschinenlesbar.

Das konzeptuelle Datenmodell von histHub lehnt sich an das Modell von CIDOC-CRM (Comité International pour la Documentation-Conceptual Reference Model, ISO 21127) an, das unterschiedliche Museen, historische Projekte und andere Institutionen weltweit seit mehr als zwanzig Jahren für die Interoperabilität ihrer Daten nutzen. Im Bereich historischer Forschung befindet sich derzeit das Konsortium «Data for History» im Aufbau. Dieses entwickelt eine Online-Plattform, die flexible und projektspezifische Anpassungen des CIDOC-CRM ermöglicht. histHub nimmt in diesem Rahmen am internationalen Workshop vom 23.–24. November 2017 teil, der vom Laboratoire de recherche historique Rhône-Alpes in Lyon organisiert wird.

Für Auskünfte und Anfragen stehen wir gerne zur Verfügung (Mail).

Facetten und Filter

openrefine

In einer Blogserie befasst sich histHub mit der Aufbereitung und Anreicherung von Daten in OpenRefine. Alle Beiträge der Serie werden in einer Übersicht gesammelt.

Im letzten Beitrag haben wir ein Projekt mit den Metadaten zu den Fotografien von Annemarie Schwarzenbach erstellt, heute befassen wir uns mit Facetten und Filtern. Die Erklärungen beziehen sich auf die Metadaten der Fotografien von Annemarie Schwarzenbach, können aber natürlich auch mit einem anderen Datansatz nachvollzogen werden.

Filter und Facetten werden jeweils für eine Tabellenpalte über deren Menü aufgerufen und angewandt. Bei einem geöffneten Projekt gibt es in der linken Seitenspalte zwei Tabs, mit denen man zwischen den Ansichten «Facet/Filter» und «Undo/Redo» wechseln kann. Für den Moment interessiert uns nur der «Facet/Filter» Tab.

Facetten

Wenn wir in der Spalte Orientierung_Form das Menü mit einem Klick auf den Pfeil neben der Spaltenüberschrift öffnen, dann «Facet» und «Text facet» wählen, wird in der linken Seitenleiste folgendes Fenster dargestellt:

Hier sind alle in dieser Spalte vorkommenden Werte mit Anzahl des Vorkommens aufgelistet. Es kann alphabetisch oder nach Anzahl sortiert werden. Ein Klick auf einen  der Werte wählt alle Zeilen mit diesem Wert aus und zeigt sie an.

Facetten sind hilfreich, um beispielsweise Schreibfehler oder Inkonsistenzen schnell zu finden und gegebenenfalls zu korrigieren. Die Einträge «QuadratHorizontal» und «HorizontalQuadrat» im obigen Beispiel könnten das gleiche meinen, zumal einer davon nur ein einziges Mal auftaucht.

Zeigen wir nun die Zeilen zu diesen beiden Ausprägungen an. Bei Mousevoer wird der aktive Eintrag im Facettenfenster grau hinterlegt, und rechts erscheinen die Schaltflächen «edit» und «include». Mit einem Klick auf «include» bei den beiden Zeilen werden nur noch die entsprechenden Beiträge in der Tabelle angezeigt. In der blau hinterlegten Kopfzeile ist «28 matching rows (3486 total)» zu sehen. Diese Information ist besonders wichtig für weitere Transformationen. Werden jetzt Transformationen auf eine Spalte oder auf Zellen einer Spalte gemacht, geschieht dies nur in diesen gematchten Zeilen.

Zur Vereinheitlichung dieser 28 Zeilen bieten sich verschiedene Möglichkeiten an:

  • Im Facetten-Fenster in der linken Seitenleiste kann «edit» gewählt werden. Das ändert alle Vorkommen dieses Eintrags. Bei einer überschaubaren Anzahl Werte wie in diesem Beispiel ist das oft die schnellere Variante.
  • Der zweite Weg ist etwas komplexer. Hier ist wichtig, dass nur die Zeilen gematched sind, also angezeigt werden, die auch bearbeitet werden sollen.
    Über das Spalten-Menü zuerst auf «Edit cells», dann «Transform…». Hier öffner sich ein Bearbeitungsfenster. In Openrefine wird üblicherweise mit der General Refine Expression Language GREL gearbeitet, es sind aber auch andere Sprachen möglich. GREL wird in einem späteren Beitrag in dieser Blogserie vertieft behandelt werden.
    Zu Beginn ist im Eingabefenster immer «value» angegeben. Wollen wir nun alle aktiven (also gematchten) Zeilen mit einem einzigen Wert befüllen, können wir diesen in Anführungszeichen eingeben. «value» benötigen wir dazu nicht:

    Nach dem Klick auf «OK» wird oben vor gelbem Hintergrund angezeigt, wie viele Zellen bearbeitet wurden. Bei diesem Beispiel ist dies eine einzige Zeile.

Filter

Ein anderer Ansatz, nur bestimmte Zeilen anzuzeigen und gegebenenfalls zu bearbeiten sind Filter. Diese betreffen nicht den gesamten Inhalt der Zelle wie die Facetten.

Im Spaltenmenü kann unter «Text filter» ein Filter aufgerufen und angewandt werden. Es ist möglich, hier Reguläre Ausdrücke zu verwenden.

In der Spalte «Orientierung_Form» kann z.B. nach «Quadrat» gefiltert werden. Gematched werden dann nicht nur die Zeilen mit dem exakten Inhalt «Quadrat», sondern beispielsweise auch «QuadratHorizontal».

Ist ein Filter aktiv, werden wie bei Facetten weitere Transformationen nur über die sichtbaren Zeilen ausgeführt. Umgekehrt kann mit Filter eine über Facetten getroffene Auswahl weiter eingeschränkt werden. Die Anzahl der gematchten, also sichtbaren Zeilen ist jeweils oberhalb der Tabelle in der blau hinterlegten Zeile zu sehen.

Kennenlernen der Daten

Facetten helfen, sich einen Überblick über die Daten zu verschaffen. Tippfehler lassen sich hier schnell beheben, wenn die Anzahl der Werte überschaubar ist. Bei grösseren Datenmengen oder wenn viele unterschiedliche Werte in einer Spalte vorhanden sind, eignet sich dafür das Clustern besser. Das Clustern wird in einem späteren Beitrag behandelt.

Mit Filtern kann gezielt nach einem bestimmten Begriff in einer Spalte gesucht werden.

Filter und Facetten helfen, die eigenen Daten kennenzulernen. Fehler in den Daten lassen sich so schnell aufspüren und korrigieren. Ausserdem ermöglichen es Filter und Facetten, nur eine bestimmte Auswahl an Zeilen zu transformieren. Dazu gibt es mehr im nächsten Beitrag.

Wünsche oder Anregungen für weitere Beiträge in dieser Blogserie nehmen wir gerne per Mail entgegen.

Erste Schritte mit OpenRefine: ein erstes Projekt

openrefineIn einer Blogserie befasst sich histHub mit der Aufbereitung und Anreicherung von Daten in OpenRefine. Alle Beiträge der Serie werden in einer Übersicht gesammelt.

OpenRefine starten

HistHub arbeitet an einer Webinstanz, in die künftig neben OpenRefine weitere Tools zur Bearbeitung historischer Daten integriert werden. Eine Alpha-Version ist bereits verfügbar. Wer schon jetzt die Online-Version testen will, kann unter net@histhub.ch einen Zugang beantragen.

Prinzipiell kann OpenRefine aber auch auf dem eigenen Computer installiert werden. Der Download und Anleitungen zur Installation für verschiedene Betriebssysteme sind auf der Website von OpenRefine verfügbar.

Beispieldatensatz – Fotosammlung Annemarie Schwarzenbach (Schweizerische Nationalbibliothek)

Für die ersten Übungen verwenden wir die Metadaten zu den Fotografien von Annemarie Schwarzenbach. Die Daten werden von der Nationalbibliothek zur Verfügung gestellt und sind auf dem Portal opendata.swiss abrufbar. Die Metadaten sind im csv-Format vorhanden.

Die Digitalisate der Fotos sind auf Wikimedia Commons verfügbar, Links auf die Digitalisate sind in der Tabelle vorhanden.

Hier geht es direkt zum Download.

Upload der Daten

In dieser ersten Übung verwenden wir den simplen Upload einer Datei vom eigenen Computer aus. Nach dem Start von OpenRefine in der Navigation links «Create Project» wählen, dann unter «Get data from» «This Computer» aussuchen. Mit einem Klick auf «Durchsuchen» kann zur zuvor gespeicherten csv-Datei navigiert werden.


Mit einem Klick auf «Next» werden die Daten geladen. Der Upload kann ein paar wenige Minuten dauern.

Konfiguration der Tabelle

Danach zeigt sich folgender Bildschirm:

Hier werden die Textdateien für den eigentlichen Import vorbereitet.

Wichtige Parameter, die häufig benötigt werden sind:

  • Zeichencodierung (Character encoding)
    In unserem Fall ist die Codierung UTF-8.
    Einen ersten Überblick über die unterschiedlichen Codierungsmäglichkeiten für westeuropäische Alphabete bietet dieser Wikipedia-Artikel.
  • Zeichen, die die Spaltengrenzen markieren (Columns are separated by)
    Die Spalten sind in unserem Beispiel mit «;» voneinander getrennt, dementspchend muss unter «custom» ein ; eingetragen werden. Neben Komma und Tab, die Standard sind, können im Customfeld alle beliebigen Zeichen eingetragen werden, an denen eine neue Spalte beginnen soll.
  • Im rechten unteren Bildschirmbereich kann man die Bearbeitung der Zeilen auswählen.
    Hierbei ist es möglich, den Import erst ab einer bestimmten Zeile zu beginnen. Hier kann unter anderem angegeben werden, ob die Spalte eine Kopfzeile hat oder nicht. («Parse next _ line(s) as column header»).

Sobald die Vorschau wie gewünscht aussieht, kann oben rechts noch ein aussagekräftiger Name gewählt werden, bevor mit einem Klick auf «Create Project» das OpenRefine Projekt angelegt wird.

Orientierung in OpenRefine

Bevor wir im nächsten Blogbeitrag mit den ersten Bearbeitungen loslegen, wollen wir uns zuerst etwas orientieren.

Oben erscheint direkt neben dem OpenRefine-Logo der Name des aktuell offenen Projekts. Mit einem Doppelklick kann der geändert werden. Das Logo führt zurück auf die Startseite von OpenRefine, wo ein neues Projekt gestartet oder ein bereits vorhandenes Projekt geöffnet werden kann. Oben rechts sind Buttons für das Öffnen eines neuen OpenRefine-Fensters, den Export des aktuell offenen Projekts und zur Hilfe.

In der linken Seitenspalte gibt es zwei Tabs. Der Facet/Filter Tab zeigt Facetten und Filter an, wenn solche ausgewählt wurden. Der Tab Undo/Redo ermöglicht es, Schritte rückgängig zu machen oder zu wiederholen. Dort ist es ausserdem möglich, Schritte zu exportieren oder zu importieren. Die Undo/Redo Funktion sowie Filter und Facetten werden in anderen Blogbeiträgen ausführlich behandelt.

In der blauen Zeile oben wird die Anzahl Zeilen angezeigt. Darunter lässt sich einstellen, wie viele Zeilen sichtbar sein sollen. In der Zeile mit den Titeln der Spalten ist bei jeder Spalte ein Pfeilsymbol. Damit lässt sich ein Menü öffnen. Fast alle Funktionen von OpenRefine verbergen sich hier. Die Spalte ganz links («All») wird von OpenRefine für jedes Projekt automatisch erstellt. Dort lassen sich Zeilen mit Stern oder Fähnchen markieren, ausserdem vergibt OpenRefine selbständig eindeutige IDs.

Soviel zum Erstellen eines Projekts und zur Orientierung in OpenRefine. Fragen, Wünsche und Anregungen können jederzeit per Mail an uns gerichtet werden.

Über OpenRefine

openrefineWer oft mit automatisch generierten oder übernommenen historischen Daten arbeitet, kennt das Problem von sogenannten «Messy Data»: Daten, die in Form und Aufbereitung noch nicht den Bedürfnissen einer historischen Fragestellung entsprechend oder in dieser Form noch nicht mit anderen Tools weiterverwendet werden können. Es kann einiges an Aufwand erfordern, diese Daten aufzubereiten und für die weitere Verarbeitung, zum Beispiel in einer Visualisierung, aufzuwerten.

Ausserdem besteht immer öfter der Wunsch, den bestehenden Grundstock an Daten mit anderen existierenden Informationen im Netz anzureichern. Derzeit bietet beispielsweise Wikidata eine einfach zu nutzende Schnittstelle an und in der Zukunft wird auch histHub seine Daten maschinenlesbar zur Verfügung stellen.

Wir werden uns in den nächsten Monaten ganz tief in unseren Daten vergraben und uns sehr intensiv mit den Möglichkeiten zur Vernetzung von historischen Forschungsdaten beschäftigen. Um die Community an unseren Erkenntnissen teilhaben zu lassen und Lösungshilfen bei ähnlichen Problemen leisten zu können, lancieren wir eine Blogserie, die sich mit den vielfältigen Möglichkeiten zur Datenaufbereitung und -anreicherung mit Hilfe von OpenRefine beschäftigen wird. OpenRefine ist ein Tool zur Bearbeitung von Messy Data. Die Beiträge zielen darauf ab, Schritt für Schritt in die Arbeit mit OpenRefine einzuführen, grundlegende Funktionsweisen und Abfragen zu erklären und einen Dialog mit der Community in Gang zu setzen.

Fragen, Wünsche und Anregungen können jederzeit per Mail an uns gerichtet werden.

HistHub und Metagrid beim Hackathon in Lausanne

Zwischen dem 14. und 16. September 2017 fand der dritte Swiss Open Cultural Data Hackathon statt. An der Universität Lausanne trafen sich zahlreiche Vertreterinnen und Vertreter von Bibliotheken, Archive und Museen mit Entwicklerinnen und Entwicklern, um gemeinsame Projektideen umzusetzen. Die Vielfalt der zur Verfügung stehenden Datensätze nimmt von Hackathon zu Hackathon erfreulich zu und umfasst unter anderem Metadaten aus Bibliothekskatalogen, Fotosammlungen, Sammlungen von Korrespondenz und anderen öffentlichen Institutionen. Die Dokumentation macht die Projekte längerfristig sichtbar und nachvollziehbar.

Im Projekt Korrespondenz von Rilke und Jung wurden beispielsweise Metadaten – zur Verfügung gestellt vom Schweizerischen Literaturarchiv (Rilke) und von der ETH-Bibliothek (Jung) – für die Visualisierung auf einer Karte und im Netzwerk vorbereitet. Im Projekt Big Data Analytics ging es um die Vernetzung und Analyse bibliographischer Metadaten unterschiedlicher Herkunft.

Ein Team des Schweizerischen Sozialarchivs nutzte den Hackathon, um die Vernetzung mit Metagrid vorzubereiten. Daneben haben weitere Institutionen eine Kooperation in Aussicht gestellt und die Gelegenheit genutzt, mehr über mögliche Einbindungen in das Netzwerk zu erfahren.

Für histHub war der Hackathon daher eine hervorragende Gelegenheit, das Projekt einer wichtigen Zielgruppe zu präsentieren und in zahlreichen Diskussionen Feedback und Anregungen zu sammeln. Hierbei zeigte sich, dass  Vernetzung und Normierung von Daten zu den wichtigen Themen der Community gehören und grosser Bedarf für die von histHub konzipierten Werkzeuge besteht.

Bild: ETH-Bibliothek

Kickoff-Meeting

Es ist soweit: histHub startet in die Aufbauphase. In den nächsten Monaten beginnen die Entwickler-Teams von histHub mit dem Aufbau der Forschungsplattform. Das Vernetzen und Normieren von Forschungsdaten zur Geschichte der Schweiz wird die Forschungspraxis der historischen Wissenschaften in der Schweiz vereinfachen.

Am Kickoff-Meeting am 31. August 2017 trafen die histHub-Teams erstmals zusammen. Neben der Projektorganisation standen auch Informationen zu Datenmodellierung, Programmierung, Kollaboration und Kommunikation auf dem Programm. Mehr als 20 Personen – die meisten haben eine Ausbildung aus dem Bereich Geschichte, Informatik und/oder den Sprachwissenschaften – haben sich an der Veranstaltung teils zum ersten mal persönlich getroffen. Informative Inputs, rege Diskussionen und der anschliessende Apéro haben den Grundstein für ein gemeinsame Projektkultur gelegt. Nun kann es bei histHub so richtig los gehen!

Interessiert an der Geschichte der Schweiz? histHub bietet Suchfunktionen für die Daten des Historischen Lexikons der Schweiz, der Diplomatischen Dokumente der Schweiz, des Schweizerdeutschen Wörterbuchs, der Rechtsquellenstiftung des Schweizerischen Juristenvereins und von vielen mehr!

Learn Metagrid Day

Metagrid

Am 9. Mai 2017 fand in der Nationalbibliothek der erste Learn Metagrid Day statt.
Metagrid, ein Service von histHub, dient der Vernetzung von geisteswissenschaftlichen Ressourcen. Der Webservice ermöglicht die Einrichtung, Verwaltung und Analyse von Links zwischen Entitäten (z.B. Personen, Körperschaften oder Orte) von verschiedenen Datenbanken und Websites.

Im Rahmen des Learn Metagrid Days wurde Metagrid 3.0 den Projektpartnern vorgestellt und in der Praxis erprobt. Im Mittelpunkt des halbtägigen Programms stand die praktische Arbeit mit den Daten und die Einbindung des Metagrid Widgets auf den Seiten der Projektpartner.

Im Rahmen der Veranstaltung wurden auch die Kernziele und Visionen von histHub genauer vorgestellt.

Phasen 2 und 3 von histHub bewilligt

Der Lenkungsausschuss des Programms «Wissenschaftliche Information» von swissuniversities hat in seiner Sitzung vom 5. Dezember über die Anträge der sechsten Projekteingabe entschieden.

Wir freuen uns sehr, dass der Antrag für den künftigen Aufbau der Plattform histHub genehmigt wurde. Der positive Entscheid belegt die produktive Konsolidierung der Kooperation zwischen führenden digitalen geschichtswissenschaftlichen Institutionen in der Schweiz.

Durch die finanzielle Unterstützung ist es möglich, in den kommenden zwei Jahren die beiden Hauptarbeitsbereiche Vernetzung und Normierung weiter auszubauen und neben der Metagrid-Suche und dem Vornamen-Thesaurus weitere Tools für die Arbeit mit geschichtswissenschaftlichen Daten zu entwickeln.

Die in der ersten Phase etablierten Kommunikationskanäle (histhub.ch, Twitter und Facebook) werden Sie auch in Zukunft über die neusten Entwicklungen auf dem Laufenden halten und Einblicke in die Ergebnisse unserer Arbeit geben.