top of page

„Open Data“ sinnvoll nutzen – mit einem Open Data Warehouse

Das Stichwort "Open Data" kann sicherlich noch nicht mit "Big Data" mithalten, wenn es um das mediale Echo und die Präsenz in Veranstaltungstiteln geht, nichtsdestotrotz taucht das Stichwort in der Welt der Datenanalyse immer wieder auf. "Open Data" bedeutet den freien Zugang zu Daten - von Wetterdaten des DWD über diverse Regionalkennzahlen der statistischen Landesämter bzw. des statistischen Bundesamtes sowie Wahlergebnisse, bis hin zu den umfassenden Datens(ch)ätzen der Bundesnetzagentur. Dieser Zugang ermöglicht die Verbesserung statistischer Prognosemodelle bzw. eröffnet generell die Möglichkeit, Use Cases umzusetzen, an deren Verwirklichung vorher nicht zu denken war.


Herausforderung der Nutzbarmachung von „Open Data“ clarifydata openDWH


Allerdings bedeutet ein freier Zugang längst noch nicht, dass „Open Data“ sofort und ohne größeren Aufwand in laufende Projekte eingebunden werden kann. Die große Herausforderung ist die tatsächliche Nutzbarmachung der frei zugänglichen Daten. Das bedeutet ganz konkret, uneinheitlich formatierte, mit verschiedenen Konventionen gefüllte und für verschiedene Zeiträume vorhandene Datenquellen in eine einheitliche Struktur zu bringen. Excel-Tabellen wollen in ein passendes Datenbankformat gebracht werden, PDF-Dateien müssen zunächst ausgelesen und dann die dabei entstandenen Fehler behoben werden. Bei uns münden diese Arbeitsschritte in unserem openDWH (Open Data Warehouse), welches aus frei zugänglichen Daten sauber strukturierte und verlässlich abrufbare Daten zu diversen Themen macht. So ist es für uns möglich, „Open Data“ tatsächlich zu nutzen und Integrationsaufwände nicht immer wieder betreiben zu müssen. Über eine einheitliche SQL-Abfrage bzw. einen REST Call lässt sich „Open Data“ so in verschiedene Projekte und Anwendungen integrieren, ohne dabei immer wieder Insellösungen zu schaffen.


Comments


bottom of page