Column Martijn Aslander

COLUMN Martijn Aslander

Oogsten

met een

verkeerde machine

Foto: Daniel Maissan

Martijn Aslander
Technologiefilosoof, internationaal spreker, auteur

‘De memo van Toeslagen-jurist Sandra Palmen verdween in een la, want het systeem had geen categorie voor “wij hebben het fout”’

‘Mijn zorg is dat probabilistische onzekerheid het werk van de informatieprofessional binnendringt waar juist zekerheid is vereist’

TIPS VAN MARTIJN

> Boektip:

Weapons of Math Destruction van Cathy O’Neil (2016)

Over hoe algoritmes individuen treffen, ver voorbij wat de makers voor ogen hadden.

> Apptip:

App Generator Prompt (wizard.jplattel.nl)

Beschrijf wat je met je data wilt doen, en de wizard genereert een prompt waarmee een AI een lokaal draaiende tool voor je bouwt. Hiermee kun je geweldige dingen doen met je eigen data, zonder dat je software hoeft te installeren en zonder dat je data de deur uitgaan.

In het meerjarenplan van het programma Open Overheid zag ik dat 2026 een oogstjaar moet worden op het gebied van de informatiehuishouding, waarbij de gemiddelde volwassenheidsscore van 2,6 naar 3 moet stijgen op een schaal van 4. Dat klinkt fantastisch, maar wat moet je nou met zo’n getal? Ik dook er wat dieper in.

HET VOGELBEKDIER IN DE MACHINE
Een zoogdier kun je herkennen aan zijn tepels. Die waarheid klopte totdat wetenschappers in 1799 voor het eerst een vogelbekdier zagen en dachten dat iemand ze voor de gek hield, want dit dier legde eieren, had een snavel, produceerde gif en had geen tepels, en toch was het onmiskenbaar een zoogdier dat in geen enkele bestaande categorie paste.

Thomas Bayes ontwikkelde het idee dat je aannames voortdurend moet bijstellen op basis van nieuw bewijs en nooit meer zekerheid mag claimen dan het bewijs toelaat. Twee eeuwen later werd dit principe toegepast in vrijwel elk systeem dat wilde leren van data, en die systemen negeerden een cruciaal element van het ontwerp van Bayes: ze bleven even zeker, ongeacht de onzekerheid.

PROBABILISTISCHE MECHANISMES
De Belastingdienst zag een patroon in haar data: heeft een burger een dubbele nationaliteit, een wisselend inkomen en een buitenlands adres? Dan gaat de risicoscore omhoog en worden toeslagen automatisch stopgezet.

In maart 2017 schreef Sandra Palmen, de hoogste jurist bij de afdeling Toeslagen, een memo dat de dienst laakbaar had gehandeld. Het verdween daarna in een la, want het systeem had geen categorie voor ‘wij hebben het fout’, net zoals het geen categorie had voor de burger die niet in het patroon paste. Mensen raakten hun baan kwijt, hun huis, en soms hun kinderen.

Doorgaans redeneren we in een rechtsstaat vanuit deterministische principes: de hele context meewegend, van geval tot geval. Maar met de komst van AI en grote datasets sluipen er probabilistische mechanismes doorheen die niet verifieerbaar zijn. De toeslagenaffaire liet zien hoe venijnig de gevolgen kunnen zijn: naast forse financiële schade leed de samenleving ook een forse deuk in het vertrouwen van de burger. Wie wind zaait zal storm oogsten.

LADDER TEGEN DE VERKEERDE MUUR
Toen ik in het meerjarenplan las wat het hoogste niveau van volwassenheid inhoudt, moest ik een paar keer opnieuw lezen. Niveau 4 heet compliancy by design. Het toppunt ervan is naleving van de afspraken in plaats van begrip of vindbaarheid van informatie. Hier lijkt iemand de bedoeling vergeten te zijn en de aanleiding van het hele project.

Wat als het op orde krijgen van de informatiehuishouding het beklimmen van een ladder tegen de verkeerde muur is?

De grootste winst zit niet in betere systemen of processen, maar in een eenvoudige keuze: sla je informatie op als naam of leg je de betekenis ervan vast? Een naam vertelt je dat iets bestaat. Betekenis vertelt je wat het is en waarom het ertoe doet. Ik werkte dit uit in wat ik het afleidingsprincipe voor informatiearchitectuur noem: als je wéét waarom wat wat is, kun je daaruit afleiden waarom dát dát is, en daardoor kun je beredeneren waarom wát dus dát is.

Zodra je dat oplost heb je het grootste deel van je informatievraagstuk opgelost en kunnen computers het tijdrovende werk van mensen doen.

DE MACHINE DIE ER AL IS
Er is één beroepsgroep die dit onderscheid van nature maakt: de informatieprofessional. Haar vak is regelgebaseerd, per document, per geval. Classificeren is geen kansberekening. De systemen die nu haar werk dreigen te vervangen werken andersom: ze berekenen de meest waarschijnlijke uitkomst op basis van trainingsdata. Mijn zorg is dat de zorgvuldigheid die dit vak kenmerkt wordt overschaduwd door de AI-hype en dat probabilistische onzekerheid sluipend het werk binnendringt waar juist zekerheid is vereist.

Mirjam Elferink schreef het in het meinummer van dit blad: de informatieprofessional is niet langer de beheerder van een archiefkast, maar de hoeder van het geheugen én geweten van de organisatie. Dat klopt, alleen een geheugen en geweten dat gokt is geen geheugen en geweten.

NIET IN HET PATROON PASSEN
Tussen 2012 en 2023 gebruikte DUO een algoritme om fraude met de uitwonendenbeurs op te sporen. Studenten uit buurten met veel inwoners met een migratieachtergrond kregen een hogere risicoscore en werden vaker gecontroleerd. Het systeem keek niet naar wat iemand had gedaan, maar naar waar iemand woonde.

In De Groene Amsterdammer las ik het verhaal van Zahra. Haar buurvrouw werd door controleurs onder druk gezet en verklaarde dat ze Zahra nog regelmatig bij haar moeder zag. Dat gegeven was genoeg en DUO concludeerde dat het wel fraude moest zijn. Zahra verloor haar beurs. Niet omdat ze had gefraudeerd, maar omdat ze niet in het patroon paste dat het systeem verwachtte. Een vogelbekdier.

Ruim tienduizend studenten werden zo ten onrechte als verdachte behandeld. De overheid trok eerst 61 miljoen euro uit om dat recht te zetten, maar de afhandeling kan door maatwerktrajecten tot 2030 duren en de kosten lopen inmiddels op naar 80 miljoen euro. Dat komt omdat de informatie nooit deterministisch werd geverifieerd. Volgens betrokkenen die ik sprak gebruikt de overheid nu dezelfde aanpak om het probleem op te lossen als waarmee het ontstond.

WAT ER WEL WERKT
Mijn advies aan de overheid: neem geen genoegen met doorzoekbare tekst, maar voorzie die tekstlaag van een extra betekenislaag door de entiteiten te duiden. In elke tekst komen elementen langs als namen van mensen, organisaties, termen en projectnamen. Als je die weet te isoleren, kun je ze verbinden met andere teksten, en die verbindbaarheid is de missende laag bij de hele overheid. Dat is veel makkelijker dan het complexere linked data dat je in veel gevallen niet nodig blijkt te hebben.

De oplossing ligt ook niet in linked data of in het veelgeprezen ecosysteem van Common Ground. Dat zijn dwaalsporen die ik in mijn volgende column zal duiden.

Het oogstjaar is een mooie belofte, maar een ervaren agrariër weet dat je met een dorsmachine geen aardappelen moet rooien. Als informatieprofessionals het kunstje onder de knie krijgen om betekenis toe te voegen aan tekst, doet de AI vervolgens waar ze het best in is: slimme vragen stellen aan gestructureerde data waar de overheid al over beschikt. Wat er dan boven komt is een schat aan verbanden die nu onzichtbaar blijft en die de overheid onnodig veel geld kost.

> Reageren op de inhoud? Mail naar redactie@informatieprofessional.nl of deel je gedachten op LinkedIn. <

IP | vakblad voor informatieprofessionals | 05 / 2026