Unterstützen
Zurück zur Projektdatenbank

tf-idf zu Babel: Text Mining zur Optimierung von automatisierten Prozessen in multilingualen Kontexten

Minor EU erreicht Migranten über Facebook-Gruppen. Wir bauen ein Tool, das relevante Beiträge automatisch filtert und die manuelle Sortierung erspart.

Explorative AnalyseModellierung Prozess
Status
Abgeschlossen
Projektzeitraum
Februar 2019 – November 2019
Partner
Minor Kontor

Minor – Projektkontor für Bildung und Forschung wird von einem interdisziplinären und interkulturellen Team getragen. Vielfältig, engagiert und wissenschaftlich fundiert arbeitet Minor mit und für gesellschaftlich marginalisierte Gruppen. Minors Mitglieder sind bundesweit und transnational aktiv in der Forschung, Programm- und Projektberatung, Weiterbildung, Netzwerkarbeit und Modellprojektentwicklung. (adaptiert von https://minor-kontor.de/ueber-minor/)

Homepage

Das Projekt "Migrationsberatung 4.0" von Minor EU konzentrierte sich auf die Unterstützung neu angekommener Migranten bei der Integration in den Arbeitsmarkt. Die Organisation trat proaktiv mit den Zielgruppen in den sozialen Medien in Kontakt, insbesondere in relevanten Facebook-Gruppen, die auf den Herkunftsländern der Migranten basieren. Um ihre Arbeit zu vereinfachen, richtete das Minor-Team E-Mail-Benachrichtigungen für neue Beiträge ein, stand aber vor der Herausforderung, irrelevante Inhalte aus der Masse der Benachrichtigungen manuell herauszufiltern. Das CorrelAid-Team nutzte R und Python, um Minor zu unterstützen, indem es ein interaktives Tool für die Beschriftung von Beiträgen entwickelte, die Filter für E-Mail-Benachrichtigungen auf der Grundlage gelabelter Daten verbesserte, deskriptive Statistiken für das Reporting zur Verfügung stellte und Experimente wie Topic Modeling und Sentiment Analysis durchführte. Das Projekt resultierte in Zeiteinsparungen, einer besseren Identifizierung relevanter Beiträge und einem verbesserten Bericht für Geldgeber. Das Projekt machte deutlich, wie wichtig klare Projektziele, die Investition von Zeit und die Qualität der Daten für erfolgreiche Datenprojekte sind.

Newsletter