Gedaan met laden. U bevindt zich op: Voorspellen van verhuiskans Projecten en onderzoek

Voorspellen van verhuiskans

Doelstelling

Dit project onderzoekt de mogelijkheid om op basis van registergegevens de verhuiskans van burgers te voorspellen. Indien succesvol kunnen deze voorspellingen vertaald worden naar een nieuwe verhuisindicator. Er zullen geen individuele verhuiskansen gepubliceerd worden. Indien uit dit project blijkt dat verhuiskans voorspellen mogelijk is, kan dit project uitgebreid worden met als doel verhuiskansen te publiceren op geaggregeerd niveau.

Dit werk is gebaseerd op de Nederlandse studie “Replacing a survey by predictive modeling using register data”, gepubliceerd in 2018 door het CBS.

Dit project werd uitgevoerd in het kader van een stage en masterproef. De gedetailleerde beschrijving van deze studie kan je hierin(PDF bestand opent in nieuw venster) terugvinden.

Gebruikte Data

Dit project maakt gebruik van een steekproef van gepseudonimiseerde registergegevens.

Dit project maakt gebruik van geaggregeerde inwonergegevens op gemeenteniveau.

Methodes

In dit project worden machine learning modellen getraind met historische verhuisgegevens om een voorspelling te maken van individuele verhuiskans. De volgende modellen worden geëvalueerd:

  • Penalized logistic regression
  • Random forest
  • XGBoost

Resultaten

De resultaten van deze studie tonen aan dat met een relatief hoge zekerheid (test set AUC van 77.3%) de kans op verhuizen kan voorspeld worden door machine learning technieken getrained op secundaire databronnen.

De volledige resultaten van dit onderzoek kunt u nalezen in de thesis.

Deze resultaten bevestigen het potentieel van secundaire gegevens als complementaire databron voor enquêtes,
Naast kans op verhuizen kunnen de methodes gebruikt in deze studies in de toekomst gebruikt worden voor de productie van andere statistiekdomeinen.