Het algoritme van de Belastingdienst had het vooral voorzien op personen met lage inkomens

In Nederland heeft de Belastingdienst een algoritme ingezet om fouten en fraude op het gebied van toeslagen aan het licht te brengen. Dit is minder goed uitgepakt dan gehoopt en vooral personen met lage inkomens zijn de dupe geworden van extra controles en valse beschuldigingen. In dit artikel leest u meer informatie over het algoritme dat de Belastingdienst inzet om fouten en fraude in de systemen aan het licht te brengen. U komt erachter hoe het kan dat vooral de personen met lage inkomens een hogere risicoscore ontvingen. Verder wordt er uitleg gegeven over de werkwijze van de Belastingdienst en wat hier mis is gegaan. Als laatste wordt er informatie over de selectiebias gedeeld.

Hoe komt het dat lage inkomens een hogere risicoscore ontvingen?

De Belastingdienst heeft aan Trouw en RTL Nieuws erkend dat de extra controle op fraude met kinderopvangtoeslagen vooral bij personen met lage inkomens plaatsvond. De Belastingdienst geeft zelfs toe dat personen met een hoog inkomen bewust werden overgeslagen tijdens de controle. Dit heeft alles met de instellingen van het risicoclassificatiemodel te maken. Dit model wordt al sinds 2013 door de Belastingdienst ingezet. Dit model kon aan de hand van het analyseren van gegevens bepalen welke aanvragen voor toeslagen die binnenkwamen, extra gecontroleerd dienden te worden.

Het model werkt met een zelflerend algoritme. Het risicomodel bepaalde zelf welke indicaties erop wezen dat aanvragen voor toeslagen op fouten of fraude konden wijzen. Iedere individuele aanvraag kreeg een risicoscore toebedeelt. De toeslagaanvragen met de hoogste risicoscores werden dan extra door medewerkers van de Belastingdienst gecontroleerd. Vanaf maart 2016 heeft het algoritme inkomens van mensen met variabele grenswaarden gebruikt. Uit onderzoek is gebleken dat uit duizend aanvragen met de hoogste risicoscore maar liefst 82,3% van de personen een huishoudinkomen onder de €20.000 euro had.

De alarmbellen moeten bij de medewerkers zelf gaan rinkelen

Experts die veel over algoritmes en de werking ervan afweten, laten aan Trouw weten dat er bij de ambtenaren allang alarmbellen hadden moeten afgaan. Een algoritme hoort helemaal niet heel specifiek op één groep afgestemd te zijn. Het feit dat bijna alleen personen met lage inkomens uit het algoritme naar voren kwamen, had al reden genoeg moeten zijn om een onderzoek in te stellen. Een algoritme kan te maken krijgen met een selectiebias. Als het model vermoedt dat er meer kans is op fraude bij lage inkomens, zal hier meer op ingezoomd worden. Wanneer hieruit correcties voor de lage inkomens voortvloeien, krijgt het algoritme gelijk en zal het alleen maar meer op deze doelgroep gaan inzoomen. Andere doelgroepen worden op dat moment buiten beeld gelaten, terwijl de controle daarop ook belangrijk is.

Hoe zit het met de selectiebias van de Belastingdienst?

Wanneer er met een algoritme op basis van risicoselectie wordt gewerkt, dient men zich volledig bewust te zijn van een mogelijke selectiebias. Dit kan men omkeren door ook aselecte aanvragen voor toeslagen te controleren. Dit is helemaal niet aan de orde geweest binnen de Belastingdienst. Alleen de hoge scores werden onderzocht en men vertrouwde volledig op het algoritme. Er dienen dus ook andere kenmerken onderzocht te worden, voordat men een gemiddeld beeld krijgt. Hier is het volgens experts dus fout gegaan bij de Belastingdienst.