Welche Daten wir bisher verarbeiten können: Asylanträge und Entscheidungen

Es ist Zeit für eine Zwischenbilanz: Was für Datenquellen können wir verarbeiten, und was sind unsere Ergebnisse?

Daten vom Bundesamt für Flüchtlinge und Migration (BAMF)

Die monatliche Antrags-, Entscheidungs- und Bestandsstatistik des Bundesamts für Migration und Flüchtlinge, aufgeschlüsselt nach Herkunftsland, können hier als PDF heruntergeladen werden: http://www.bamf.de/SharedDocs/Anlagen/DE/Downloads/Infothek/Statistik/Asyl/hkl-antrags-entscheidungs-bestandsstatistik-august-2017.html. Das sieht dann so aus:

statistik_bamf_201708

Wir machen aus den Daten eine csv-Datei, um sie besser verarbeiten zu können:

201708,Albanien,121,575,368,207,908,0,2,0,4,514,388,663,241,0,2,0,4,483,94,0,0,0,0,31,247,47
201708,Bosnien und Herzegowina,122,89,46,43,155,0,0,0,2,80,73,137,64,0,0,0,2,65,16,0,0,0,0,15,54,3
201708,Belgien,124,0,0,0,0,0,0,0,0,0,0,2,0,0,0,0,0,0,0,0,0,0,0,0,0,0
201708,Bulgarien,125,0,0,0,1,0,0,0,0,1,0,5,0,0,0,0,0,1,0,0,0,0,0,0,0,0

Daraus kann beispielsweise Datawrapper ein Histogramm bauen:

syrien_2015_2016

Das ist mittlerweile ein etabliertes Verfahren und funktioniert zuverlässig.

Daten von eurostat

Eurostat ist das statistische Amt der Europäischen Union. Sie sammeln Zahlen von etwa 32 europäischen Ländern zu Asylanträgen, Entscheidungen, Dublinverfahren, meist nach Staatsangehörigkeit, Alter und Geschlecht:

  • Asylbewerber (monatlich in tps00189 und migr_asyappctzm, jährlich in tps00191 und migr_asyappctza)
  • anhängige Asylverfahren (monatlich tps00190, migr_asypenctzm)
  • Erstinstanzliche Entscheidungen (migr_asydcfstq migr_asydcfsta und tps00192)
  • Endgültige Entscheidungen (tps00193)
  • Entzug von erstinstanzlich gewährtem Status (migr_asywitfsta und migr_asywitfstq)
  • Entzug von endgültig gewährtem Status (migr_asywitfina)
  • Umsiedlungen (migr_asyresa)
  • unbegleitete Minderjährige (tps00194 und migr_asyuna)
  • zurückgezogene Asylanträge (migr_asywitha und asywithm)

Und diverse Statistiken zum Dublinverfahren (migr_dub).

Eurostat erlaubt Zugriff auf seine Datenbanken per „data explorer„, was etwa so aussieht:

eurostat_screenshot

 

Diese Daten können über verschiedene Schnittstellen geholt werden. Wir arbeiten an zwei Verfahren:

Json zu Elasticsearch / Kibana: Interaktive Dashboards

Der Code hierfür ist in https://github.com/muc-fluechtlingsrat/elastify-eurostat , und das Resultat sieht so aus – für die Antragsdaten:

kibana_screenshot

Wir arbeiten daran, Zugriff auf diese interaktiven Dashboards zu ermöglichen. Dann kann man beispielsweise sich beispielsweise alle Anträge von einem bestimmten Herkunftsland anzeigen lassen.

R: Statistische Auswertungen

Außerdem arbeiten wir daran, die Daten mit der Sprache „R“ zu verarbeiten (https://github.com/muc-fluechtlingsrat/r-eurostat-refugees)

Refugee Datathon, der dritte

Nach dem ersten  und dem zweiten Refugee Datathon kommt¹: Der dritte!

https://www.meetup.com/de-DE/welcomehelp/events/234114103/

Am 30. September ist Tag des Flüchtlings. Lasst uns Daten dafür vorbereiten. Innerhalb Deutschlands werden Flüchtlinge nach dem Königssteiner Schlüssel verteilt, https://de.wikipedia.org/wiki/K%C3%B6nigsteiner_Schl%C3%BCssel. Die rechtliche Grundlage ist, wer wie viel beizutragen hat, um internationalen Verpflichtungen nachzukommen. Die Berechnung basiert auf Steuereinnahmen und Anzahl Einwohner. Wenn wir diese Rechnung weltweit machen, was kommt dabei heraus? Und wie sieht die tatsächliche Verteilung aus?

(Fußnote 1: Wenn man’s genau nimmt, kam zwischen 2 und 3 ein Quiz, das ist aber noch nicht fertig.)

Refugee Datathon, der zweite

Am 18. Juni stieg der zweite Refugee Datathon!
Diesmal im WERK1, und mit Unterstützung der Open Knowledge Foundation Deutschland .

Es wurde wieder konzentriert gearbeitet, die Ergebnisse sind:

  1.  Vergleich von Schutzquoten über die Länder Europas. Wir fanden auffälllige Unterschiede für Afghanistan und Pakistan.
    Quelle: Eurostat
    Tool: Excel
    Resultate (nicht mehr Excel): Vergleich von Schutzquoten in Europa
  2. Visualisierung: Eine viel bessere Darstellung als unser bisheriges Histogramm. Als skalierbare Vektorgrafik (SVG), jetzt sind die verschiedenen Quoten direkt vergleichbar, und die absoluten Zahlen werden als Fläche dargestellt. https://github.com/muc-fluechtlingsrat/data-visualization/blob/master/2016_01_Protection_Rates_BC.svg.
    Quelle: Ergebnisse des Datathon 1.
    Tool: R
  3. Alarmierung per email, wenn das BAMF neue Asylgeschäftsstatistiken hochlädt. Als crawler, nachdem der „RSS-Feed-Nachbau“ nicht : https://github.com/muc-fluechtlingsrat/bamf-thats-new.
    Tool: Php, und mit Host für Cronjob und email-Versand. Funktioniert!
  4. Rohdaten der Entscheidungen über Asylanträge in Deutschland, alle Herkunftsländer, monatlich vom Januar 2015 bis April 2016. https://github.com/muc-fluechtlingsrat/bamf-asylgeschaeftsstatistik/tree/master/raw
    Quelle: BAMF, Antwort auf unsere fragdenstaat.de-Frage des Datathon 1
    Tools: Tabula, Unix Tools
    Resultate: Syrien: Immer mehr subsidiärer Schutz statt Flüchtlingsschutz

Und ein Ergebnis der Vorbereitung war, dass die Zahlen zum Easy-Gap bereits aufgearbeitet wurden. Einen Beitrag dazu gibt es hier: Das EASY-Gap

 

Refugee Datathon Munich, der erste

Unser erster Refugee Datathon fand am 7. Mai statt, als Meetup der Gruppe „hack4refugees“.

Was ist ein Datathon?

So etwas Ähnliches wie ein Hackathon, aber mit Daten. Und dadurch auch mit mehr Inhalt und Bezug zur „Welt draußen“. Deshalb ist „Domain specific knowledge“ wichtig, damit das Ganze Sinn macht. Bei unserem Datathon musste beispielsweise jemand wissen, was „subsidiärer Schutz“ ist.
Genau wie bei einem Hackathon ist die Stimmung: Aus reiner Begeisterung verbringen diese Leute einen der sonnigsten Samstage des Jahres vor ihrem Laptop. Und es gibt Pizza.
Aber „Datathons“ sind viel jünger als Hackathons. Unserer war vermutlich der erste Datathon in Deutschland!

Was ist das Besondere an unserem „Refugee Datathon“?

Hier treffen sich 3 Welten, die alle viel mitbringen:
– Die IT Community – produktive und motivierte Leute
– Die Bewegung für Flüchtlinge in Deutschland – auch im Sommer 2016 stark
– Datenexperten – und zwar nicht irgendwelche Datenexperten, sondern Leute aus der Richtung „Open Knowledge“ / „Open Data“ / „Open Government“.
Das ist eine hochkreative Mischung.

Was haben wir erarbeitet?

Im Ergebnis: Schutzquoten.

Vom Verlauf her:

Das BAMF (Bundesamt für Flüchtlinge und Migration) veröffentlicht jeden Monat eine Asylgeschäftsstatistik.
Der Münchner Flüchtlingsrat macht damit – wenn sie die Zeit dazu haben:

  1. Nachschauen, ob der neue Bericht da ist.
  2. Das PDF herunterladen.
  3. Das PDF in Word öffnen.
  4. Die Tabellen daraus in Excel kopieren.
  5. In Excel neue Werte berechnen, beispielsweise die bereinigte Schutzquote
  6. Grafiken in Excel erstellen.
  7. Diese verwenden – beispielsweise auf Vorträgen zeigen.

Das finden sie normal, aber IT-Leute leiden, wenn sie das hören. Also haben wir:

ad 1. : Einen Alert aufgesetzt, der ein email verschickt, wenn der neue monatliche Bericht hochgeladen wird;
ad 2. : Ein php-Programm geschrieben, das das PDF herunterlädt …
ad 3.-5. : … und per „Tabula“ die Tabelle in csv umwandelt, und dieses csv dann bereinigt, und die Werte berechnet.

Das mit den Grafiken haben wir nicht mehr geschafft, und die Veröffentlichung überlassen wir vorerst Menschen. Die erste wird auf diesem Blog erscheinen.

Außerdem haben wir eine Anfrage nach den Rohdaten an das BAMF gestellt, per fragdenstaat.de und unter Berufung auf das Informationsfreiheitsgesetz. Emails und ein Anruf hatten nichts gebracht. Aber die „Open Data“ Aktivisten kennen sich mit diesen Dingen aus.

Zusätzlich veröffentlichen wir unsere csv-Daten auf github, mit Metainformationen in einem Protokoll der Open Knowledge Foundation.

Wie geht es weiter?

Mit dem nächsten Datathon: http://www.meetup.com/de-DE/welcomehelp/events/231290958/

Wer steckt hinter dem Datathon?

Wir waren: 3 Programmierer, 2 Admins, 1 Projektleiterin, 4 langjährige Flüchtlingsaktivist/innen, 1 OpenData-Aktivist – also 7 Leute. Unsere Resourcen an technischen Fähigkeiten, Fachwissen und Engagement sind größer als die an Räumen und Pizza – deshalb war der Kreis erst einmal klein. Der Refugee Datathon 2 kommt!

Beteiligte Organisationen: welcomehelp/hack4refugees; Münchner Flüchtlingsrat; kleineanfragen.de; Amnesty International Asylgruppe München