Über OpenRefine

Wer oft mit automatisch generierten oder übernommenen historischen Daten arbeitet, kennt das Problem von sogenannten «Messy Data»: Daten, die in Form und Aufbereitung noch nicht den Bedürfnissen einer historischen Fragestellung entsprechend oder in dieser Form noch nicht mit anderen Tools weiterverwendet werden können. Es kann einiges an Aufwand erfordern, diese Daten aufzubereiten und für die weitere Verarbeitung, zum Beispiel in einer Visualisierung, aufzuwerten.

Ausserdem besteht immer öfter der Wunsch, den bestehenden Grundstock an Daten mit anderen existierenden Informationen im Netz anzureichern. Derzeit bietet beispielsweise Wikidata eine einfach zu nutzende Schnittstelle an und in der Zukunft wird auch histHub seine Daten maschinenlesbar zur Verfügung stellen.

Wir werden uns in den nächsten Monaten ganz tief in unseren Daten vergraben und uns sehr intensiv mit den Möglichkeiten zur Vernetzung von historischen Forschungsdaten beschäftigen. Um die Community an unseren Erkenntnissen teilhaben zu lassen und Lösungshilfen bei ähnlichen Problemen leisten zu können, lancieren wir eine Blogserie, die sich mit den vielfältigen Möglichkeiten zur Datenaufbereitung und -anreicherung mit Hilfe von OpenRefine beschäftigen wird. OpenRefine ist ein Tool zur Bearbeitung von Messy Data. Die Beiträge zielen darauf ab, Schritt für Schritt in die Arbeit mit OpenRefine einzuführen, grundlegende Funktionsweisen und Abfragen zu erklären und einen Dialog mit der Community in Gang zu setzen.

Fragen, Wünsche und Anregungen können jederzeit per Mail an uns gerichtet werden.