Hands-on „Daten säubern, aufbereiten und georeferenzieren mit OpenRefine“

Download iCal

Leitung: Torsten Hiltmann (Münster)

Immer häufiger nutzen wir Listen und Tabellen, um für unsere Forschungen wichtige Daten zu Personen, Zeiten, Orten, Dokumenten usw. zusammenzutragen und auszuwerten. Häufig kommen diese Daten aber aus unterschiedlichen Quellen bzw. wurden in unterschiedlicher Weise aufgenommen. Die Folge sind unterschiedliche Schreibweisen von Namen und Begriffen oder unterschiedliche Formate bei der Datumsangaben, die einer raschen seriellen Auswertung schnell Grenzen setzen.  Statt dessen haben wir es mit “schmutzigen Daten” zu tun, die vor einer Auswertung gereinigt und vereinheitlicht werden müssen.

Je nach Fragestellung und Vorgehen kann es zudem hilfreich sein, die Daten neu zu strukturieren und um weitere Informationen aus dem Netz (z.B. Geodaten für Ortsangaben) zu erweitern. Das alles kann man mit viel Geduld händisch erledigen, oder aber entsprechende Tools einsetzen, wie zum Beispiel OpenRefine, das für all diese Aufgaben verschiedene, einfach zu nutzende Möglichkeiten bereitstellt. Im Rahmen der Hands-on Session sollen diese vorgestellt und an einem kleinen Praxisbeispiel gemeinsam ausprobiert werden.

 

Technische Voraussetzungen: Bitte bringen Sie ihren eigenen Rechner mit. Das CDH Münster bietet einen eigens für die Hands-on Sessions konfigurierte Virtuellen Desktop an. Bitte installieren Sie hierfür auf ihrem Gerät das Programm „VMware Horizon Client“, das unter https://zivvdi.uni-muenster.de/ heruntergeladen werden kann.