Bitte stell dich unseren BlogleserInnen kurz vor: Wer bist du und was muss man über dich wissen?

Mein Name ist Simon Munzert, ich bin Politikwissenschaftler und arbeite derzeit als wissenschaftlicher Mitarbeiter an der Humboldt-Universität zu Berlin. Ich forsche gerade dazu, wie Wahlen möglicherweise ausgehen, das Internet Meinungsbildung und politische Kommunikation beeinflusst und zu einigen anderen eher exotischen Themen. Online findet man mich hier und da.

Mit CorrelAid verbindet mich mindestens zweierlei – zum einen hatte ich das Vergnügen, einige Gründungsmitglieder während meiner Zeit als Doktorand an der Universität Konstanz kennenzulernen, zum anderen durfte ich dem Netzwerk als Mitglied im Beirat über die letzten Jahre bei dem Erreichen von vielen Meilensteinen zusehen.

Das Ziel von CorrelAid ist es, junge und sozial engagierte DatenanalystInnen deutschlandweit zu vernetzen und Non-Profit-Organisationen bei der Datenanalyse zu unterstützen. Wo siehst du in deinem Berufsfeld mögliche Potenziale - und etwaige Synergieeffekte - dieser aufkommenden Data for Good-Bewegung, um einen gesellschaftlichen Mehrwert zu schaffen?

Datenanalyse-Skills sind in den empirischen Sozialwissenschaften wichtiger denn je. Schließlich findet immer mehr soziale Interaktion, politische Kommunikation, Meinungsäußerung, Überzeugungsarbeit von Parteien etc. im Netz statt. Wenn man sich also für solche Prozesse interessiert, liegt es nahe, dieses neue Daten-Eldorado genauer unter die Lupe zu nehmen, und dafür braucht es neue technischen Skills, die noch zu selten in sozialwissenschaftlichen Studiengängen gelehrt werden. Das wird hoffentlich in den nächsten Jahren noch zunehmen. Dann kann mein Berufsfeld – Lehre an der Universität bedeutet ja, die Forscherinnen und Forscher der Zukunft auszubilden – hoffentlich dazu beitragen, CorrelAid und damit auch außeruniversitäre Organisationen mit klugen Köpfen zu versorgen!

Dank Digitalisierung nimmt auch die Bedeutung von digitaler Kommunikation in der Arbeitswelt immer stärker zu. Welchen Social Media-Kanälen (Blogs, Twitter-Accounts und/oder Facebook-Seiten) sollte man in deinem Fachgebiet auf jeden Fall folgen, um inhaltlich auf dem Laufenden zu bleiben?

Wenn ich mein Fachgebiet mal als "Politikwissenschaft mit Schwerpunkt Wahlen, öffentliche Meinung und Data Science" definiere, fallen mir an Blogs und Feeds ein:

1. Der Monkey-Cage-Blog der Washington Post

2. Die wöchentlichen Link Dumps des WZB Data Science Blog

3. Die täglichen CRANberries – neue Pakete für R, bei Planet R

Bei Twitter-Accounts ist die Auswahl fast zu groß. Am besten allen folgen, die man hier findet.

Das Management-Magazin Harvard Business Review bezeichnete den Beruf des Data Scientist bereits 2012 als "sexiest job in the 21st century". Welchen Stellenwert nehmen DatenanalystInnen heutzutage in deinem Berufsfeld ein und wie sieht deine Prognose für die Zukunft aus?

Der Begriff Data Scientist wird natürlich extrem überstrapaziert, und es ist natürlich auch kein Phänomen des 21. Jahrhunderts. Empirisch orientierte Forschung war schon datenbasiert, als Archimedes vor 2000 Jahren in der Wanne saß und den statischen Auftrieb entdeckt hat. Aber klar hat sich in meiner Disziplin, der Politikwissenschaft – und sicherlich auch in den Sozialwissenschaften generell – in den letzten Jahren noch einmal viel getan. Die Vielfalt der Methoden und Techniken, die mittlerweile im Mainstream der Forschung angekommen sind, lassen sich in einem Forscherleben gar nicht mehr alle erlernen. Deshalb wäre meine Prognose für die Zukunft: Technische (und vor allem Programmier-)fähigkeiten werden wichtiger denn je; darüber hinaus wird sich die Spezialisierung weiter fortsetzen. Ich glaube (und hoffe) nicht, dass diese Fähigkeiten durch Informatik bzw. Computerwissenschaften obsolet gemacht werden. Politikwissenschaftliche Spitzenforschung wird auch in Zukunft sowohl Daten- und Statistikskills als auch ein gutes Verständnis der Literatur und theoretischen Grundlagen voraussetzen. Deshalb meine Empfehlung an junge Forscherinnen und Forscher: Eignet Euch so früh wie möglich technische Fähigkeiten an (das Erlernen einer populären Programmiersprache wie R oder Python wäre ein guter erster Schritt) und verliert gleichzeitig Eure inhaltlichen Interessen nicht aus den Augen! Dann werden Euch alle Türen offenstehen.

Einer deiner Forschungsschwerpunkte ist das Sammeln von Webdaten. Was fasziniert dich so an dieser Form der Datenerhebung?

Ich bin von Natur aus eine eher skeptische Person. Da sind Daten, anhand derer man Vorurteile und Erwartungen überprüfen oder eigene Entscheidungen motivieren kann, meistens eine gute Hilfe. Das ist aber natürlich ein alter Hut. Das relativ neue an Webdaten ist, dass mit dem rasanten Wachstum des Web und aller seiner Facetten heute praktisch jeder Zugang zu allen möglichen Informationen hat. Man denke nur an Google: Im Prinzip ist eine Google-Anfrage nichts anderes als eine einfache Form der Datenerhebung, um Antworten auf oft ebenfalls einfache Fragen zu finden. Wenn Fragen komplexer werden, können uns andere Datenquellen weiterhelfen. Vieles dessen, was wir online beobachten können – wonach die Leute suchen, wem sie in sozialen Netzwerken folgen, was sie posten oder konsumieren – verbirgt auch Informationen über Präferenzen und soziales Verhalten. Das finde ich als Sozialwissenschaftler natürlich extrem spannend – wir haben mittlerweile die Möglichkeit, Menschen im großen Stil "in freier Wildbahn" zu beobachten und sind nicht mehr zwangsläufig darauf angewiesen, sie zu ihren Zielen, Einstellungen und Verhalten auszufragen. Gleichzeitig zieht das natürlich eine Reihe von Fragen nach sich, die technischer oder – noch wichtiger – ethischer Natur sind. Den letzten großen Turn dieser Art hatten wir in den Sozialwissenschaften in der Mitte des letzten Jahrhunderts, als Bevölkerungsbefragungen populär wurden. Es ist also ziemlich aufregend, eine neue Zeitenwende in der empirischen Sozialforschung mitzuerleben.

Redaktionelle Anmerkung von Lisa: An dieser Stelle möchte ich euch Simons Lehrbuch zu Web Scraping und Text Mining mit R ans Herz legen, welches mir den Einstieg in das Thema damals enorm erleichtert hat. Aus gut unterrichteter Quelle weiß ich zudem, dass eine aktualisierte Neuauflage bereits in Arbeit ist. Seid also gespannt!