Annemarie Schwarzenbach

histHub setzt sich seit Oktober mit den Metadaten zu den Fotografien von Annemarie Schwarzenbach auseinander. In einer Blogserie zeigen wir, wie die tabellenförmigen Daten in OpenRefine verbessert und angereichert werden können. Aus Anlass des 75. Todestags von Annemarie Schwarzenbach hat das Schweizerische Literaturarchiv nun über 3000 Fotografien auf Wikimedia Commons zur Verfügung gestellt. Für histHub bietet dies Gelegenheit, den Blick über die Metadaten zu den Fotografien hinaus auf das Schaffen von Annemarie Schwarzenbach und ihre jetzt offen verfügbaren Bilder zu erweitern. […]

Bericht: Workshop on the creation of an international Data for History consortium


Vom 23. bis 24. November 2017 fand an der École normale supérieure in Lyon ein Workshop zur Gründung des internationalen Konsortiums Data for History statt, der vom Pôle histoire numérique des Laboratoire de recherche historique Rhône-Alpes organisiert wurde. Am Workshop nahmen rund 40 Expertinnen und Experten aus den Niederlanden, Frankreich, Griechenland, Italien, Deutschland, Luxemburg, Österreich und der Schweiz teil. Nach der herzlichen Begrüssung durch den Gastgeber Bernard Hours (Université Jean-Moulin Lyon 3, Direktor des Laboratoire de recherche historique Rhône-Alpes) führte […]

Cluster

HistHub befasst sich in einer Blogserie mit der Aufbereitung und Anreicherung von Daten in Openrefine. Dieser Beitrag beschäftigt sich mit Clustern als Methode zum Reinigen von Daten und mit den verschiedenen Methoden, die OpenRefine dafür bietet. Die Beispiele und Screenshots in diesem Beitrag stammen wieder aus dem Projekt mit den Metadaten zu den Fotografien von Annemarie Schwarzenbach. Die Arbeitsschritte können mit einem anderen Datensatz (oder über andere Spalten dieses Datensatzes) nachvollzogen werden. Cluster sind Vorschläge des Computers, welche Einträge in […]

Bearbeiten von Spalten und Zellen

HistHub befasst sich in einer Blogserie mit der Aufbereitung und Anreicherung von Daten in Openrefine. Dieser Beitrag zeigt häufig angewandte Transformationen. Als Grundlage dienen weiterhin die Metadaten zu den Fotografien von Annemarie Schwarzenbach, die im Beitrag über das Erstellen eines OpenRefine Projekts vorgestellt wurden. Häufige Transformationen Die Spalte «Titel_Name» enthält Informationen über die Fotografie, die meist aus einem Land, einem Ortsnamen und einer genaueren Bezeichnung bestehen. Diese wollen wir extrahieren. Es gibt in der Tabelle zwar eine Spalte «Ort», mit […]

histHub-Ontologie

In histHub entstehen Normdaten zu den Hauptentitäten Personen, Orte, Organisationen und Konzepte sowie Thesauri zu verschiedenen Unterentitäten wie z. B. Vornamen (histHub-fornames), Orts- und Organisationstypen, Berufen etc. Thesauri sind standardisierte Vokabulare, die sowohl hierarchisch als auch in beliebigen Relationen strukturiert sind und das in einem Themengebiet gebrauchte Vokabular beschreiben und normieren. histHub modelliert die Normdaten mit Hilfe einer Ontologie. Die histHub-Ontologie strukturiert Daten anhand eines eindeutig definierten und dokumentierten Datenmodells und bildet den historischen Diskurs über die Wirklichkeit in Daten ab. […]

Facetten und Filter

In einer Blogserie befasst sich histHub mit der Aufbereitung und Anreicherung von Daten in OpenRefine. Alle Beiträge der Serie werden in einer Übersicht gesammelt. Im letzten Beitrag haben wir ein Projekt mit den Metadaten zu den Fotografien von Annemarie Schwarzenbach erstellt, heute befassen wir uns mit Facetten und Filtern. Die Erklärungen beziehen sich auf die Metadaten der Fotografien von Annemarie Schwarzenbach, können aber natürlich auch mit einem anderen Datansatz nachvollzogen werden. Filter und Facetten werden jeweils für eine Tabellenpalte über […]

Erste Schritte mit OpenRefine: ein erstes Projekt

In einer Blogserie befasst sich histHub mit der Aufbereitung und Anreicherung von Daten in OpenRefine. Alle Beiträge der Serie werden in einer Übersicht gesammelt. OpenRefine starten HistHub arbeitet an einer Webinstanz, in die künftig neben OpenRefine weitere Tools zur Bearbeitung historischer Daten integriert werden. Eine Alpha-Version ist bereits verfügbar. Wer schon jetzt die Online-Version testen will, kann unter net@histhub.ch einen Zugang beantragen. Prinzipiell kann OpenRefine aber auch auf dem eigenen Computer installiert werden. Der Download und Anleitungen zur Installation für […]

Über OpenRefine

Wer oft mit automatisch generierten oder übernommenen historischen Daten arbeitet, kennt das Problem von sogenannten «Messy Data»: Daten, die in Form und Aufbereitung noch nicht den Bedürfnissen einer historischen Fragestellung entsprechend oder in dieser Form noch nicht mit anderen Tools weiterverwendet werden können. Es kann einiges an Aufwand erfordern, diese Daten aufzubereiten und für die weitere Verarbeitung, zum Beispiel in einer Visualisierung, aufzuwerten. Ausserdem besteht immer öfter der Wunsch, den bestehenden Grundstock an Daten mit anderen existierenden Informationen im Netz anzureichern. Derzeit […]

HistHub und Metagrid beim Hackathon in Lausanne

Zwischen dem 14. und 16. September 2017 fand der dritte Swiss Open Cultural Data Hackathon statt. An der Universität Lausanne trafen sich zahlreiche Vertreterinnen und Vertreter von Bibliotheken, Archive und Museen mit Entwicklerinnen und Entwicklern, um gemeinsame Projektideen umzusetzen. Die Vielfalt der zur Verfügung stehenden Datensätze nimmt von Hackathon zu Hackathon erfreulich zu und umfasst unter anderem Metadaten aus Bibliothekskatalogen, Fotosammlungen, Sammlungen von Korrespondenz und anderen öffentlichen Institutionen. Die Dokumentation macht die Projekte längerfristig sichtbar und nachvollziehbar. Im Projekt Korrespondenz […]

Kickoff-Meeting

Es ist soweit: histHub startet in die Aufbauphase. In den nächsten Monaten beginnen die Entwickler-Teams von histHub mit dem Aufbau der Forschungsplattform. Das Vernetzen und Normieren von Forschungsdaten zur Geschichte der Schweiz wird die Forschungspraxis der historischen Wissenschaften in der Schweiz vereinfachen. Am Kickoff-Meeting am 31. August 2017 trafen die histHub-Teams erstmals zusammen. Neben der Projektorganisation standen auch Informationen zu Datenmodellierung, Programmierung, Kollaboration und Kommunikation auf dem Programm. Mehr als 20 Personen – die meisten haben eine Ausbildung aus dem […]