tf-idf zu Babel: Text Mining zur Optimierung von automatisierten Prozessen in multilingualen Kontexten
- Status
- Abgeschlossen
- Projektzeitraum
- Februar 2019 – November 2019
- Outputs
- Blogbeitrag
- Partner
Das Projekt "Migrationsberatung 4.0" von Minor EU konzentrierte sich auf die Unterstützung neu angekommener Migranten bei der Integration in den Arbeitsmarkt. Die Organisation trat proaktiv mit den Zielgruppen in den sozialen Medien in Kontakt, insbesondere in relevanten Facebook-Gruppen, die auf den Herkunftsländern der Migranten basieren. Um ihre Arbeit zu vereinfachen, richtete das Minor-Team E-Mail-Benachrichtigungen für neue Beiträge ein, stand aber vor der Herausforderung, irrelevante Inhalte aus der Masse der Benachrichtigungen manuell herauszufiltern. Das CorrelAid-Team nutzte R und Python, um Minor zu unterstützen, indem es ein interaktives Tool für die Beschriftung von Beiträgen entwickelte, die Filter für E-Mail-Benachrichtigungen auf der Grundlage gelabelter Daten verbesserte, deskriptive Statistiken für das Reporting zur Verfügung stellte und Experimente wie Topic Modeling und Sentiment Analysis durchführte. Das Projekt resultierte in Zeiteinsparungen, einer besseren Identifizierung relevanter Beiträge und einem verbesserten Bericht für Geldgeber. Das Projekt machte deutlich, wie wichtig klare Projektziele, die Investition von Zeit und die Qualität der Daten für erfolgreiche Datenprojekte sind.