ZOEKEN EN VINDEN MAARTEN HAFKAMP
Maarten Hafkamp
Freelance journalist, schrijver en scenarioschrijver
Bij de Victorines eind vorig jaar sleepte Robert Nat, dataspecialist bij de provincie Groningen, een eervolle vermelding in de wacht voor zijn datagedreven aanpak van Woo-verzoeken. Hij wist daarmee efficiĆ«nt relevante documenten op te leveren aan journalisten voor de zogeheten Shell Papers. āAl snel bleek dat je als informatie-/dataspecialist toch wel erg handig bent met de wat complexere zoekvragen.ā
Robert Nat
āDe aanpak van samenwerking met de indiener wordt de laatste tijd ook ondersteund met een aantal uitspraken van rechtbankenā
āDe reguliere Woo voelt vaak als een strafcorvee en is zeker niet leuk om als ambtenaar op je bureau te krijgenā
āIk merkte al snel dat ik met mijn data-achtergrond een dominantere rol kon spelen binnen het projectteamā
āDe provincies Groningen en Drenthe en de gemeenten Groningen en Assen waren van begin af aan overtuigd dat ze gewoon moesten leverenā
Onderzoeksjournalisten van PAJ, FTM, RTV Noord en RTV Drenthe dienden in 2019 een uitgebreid verzoek in bij het ministerie van Economische Zaken (EZ) en de provincie Groningen in het kader van de Wet open overheid (Woo), met als doel de banden tussen Shell en de Nederlandse overheid te onderzoeken ā ook wel de Shell Papers genoemd. Diverse ministeries, waaronder het ministerie van EZ, weigerden het verzoek in behandeling te nemen. Maar āzijnā provincie is hier niet in meegegaan, zegt Robert Nat, die een bepalende rol speelde in het verzoek. Hij ontwikkelde een methode om snel grote aantallen documenten te doorzoeken. āDe Groningse aanpak als datagedreven afhandeling van de Woo-verzoekenā, omschrijft hij het. āDe provincies Groningen en Drenthe en de gemeenten Groningen en Assen vonden dat ze het zich niet konden veroorloven om dezelfde houding aan te nemen als de andere bestuursorganen. Dus wij waren van begin af aan overtuigd dat we gewoon moesten leveren.ā
DOMINANTERE ROL
Nat werd als informatieanalist gekoppeld aan het Woo-verzoek Shell Papers en de voorbereiding van de parlementaire enquĆŖte aardgaswinning in Groningen. āAl snel bleek dat je als informatie-/dataspecialist toch wel erg handig bent met grote hoeveelheden documenten en de wat complexere zoekvragen. In eerste instantie vroegen ze me om als verbinder te dienen tussen de afdeling ICT en de projectgroep. Ik merkte echter al snel dat ik met mijn data-achtergrond een dominantere rol kon spelen binnen zoān projectteam. Ik kon het voor iedereen eenvoudiger maken: voor zowel de indieners als onze medewerkers.ā
VEEL OVERLEG OVER QUERY
Hoe zag zijn aanpak eruit? āWe hebben heel veel overlegd met de indieners over de query, de combinatie van trefwoorden waarmee relevante documenten gevonden moesten wordenā, legt hij uit. āDat is een behoorlijk uitgebreide combinatie van trefwoorden geworden, inclusief verwijzingen naar hoe je omgaat met bijvoorbeeld datumbereik van het hoofdstuk. Dat is dus aan de kant van de indiener. Aan de datakant heb ik vooral met onze functioneel beheerders van de diverse applicaties overlegd: hoe gaan we nou deze query afvuren op onze systemen? We hebben er toen voor gekozen om het simpel te houden en elk trefwoord apart af te vuren. Dan haal je weliswaar veel te veel documenten op, maar je weet in ieder geval zeker dat het genoeg is.ā
Naast veel āafvalā krijg je ook nieuwe inzichten, weet hij. āEen daarvan was een simpele: het woord āenergieā. De indieners wilden weten wat het Interprovinciaal Overleg (IPO) op het gebied van energie allemaal aan het doen was. Daarbij bleek dat het IPO in documenten vooral steeds sprak over āheel veel energie stekenā in allerlei zaken. Daar kwamen we dus niet verder mee, en we hebben de informatie echt op een andere manier moeten ophalen.ā
āSHELLā IN DE NAAM
Er waren drie belangrijke kenmerken van de Groningse aanpak. Het eerste was werken vanuit een gemeenschappelijk belang. Nat: āDe Groningse aanpak is vooral heel transparant richting de indiener, omdat je in overleg bepaalt welke trefwoorden relevant zijn voor de vertaling van het Woo-verzoek zoals dat op papier staat. Daardoor kun je ook goed aangeven welke systemen zullen worden bevraagd en welke trefwoorden daarbij gaan worden gebruikt.ā
Je kunt zo eenvoudig aantonen dat bepaalde bronnen zijn bevraagd, wat de gebruikte trefwoorden zijn en wat het aantal documenten is dat je initieel boven water hebt gehaald, stelt hij. āDaar moet dan nog wel een zoekslag overheen. Bij de Shell Papers was het voor de indieners lastig om aan te geven wat ze wilden hebben, maar wat ze nĆet wilden hebben was wel duidelijk. Bijvoorbeeld alles met betrekking tot vuurwerkvergunningen, want daar zit ook āshellā in. Of de bouw van tanks ten behoeve van de chemische industrie, want die hebben een āinner shellā en āouter shellā. Risicoberekeningen bevatten ook āshellā in de naam van het bestand. En er waren factuurlijsten waarin de NAM en de Shell als tankstation voorkwamen. Deze documenten waren allemaal niet relevant. Op deze manier kun je veel transparanter te werk gaan. Het gebruik van trefwoorden haalt eigenlijk het volledige blackboxgedeelte eraf.ā
ONTZORGEN MEDEWERKER
Het tweede kenmerk van de aanpak was: neem contact op met de verzoekers, laat de vraag preciseren en zet de zogeheten āvertrouwelijke voorinzageā in. Zo help je de indiener, maar het ontzorgen van de medewerker is voor Nat nog veel leuker, vertelt hij. āWij geven precies aan wat we nodig hebben en de medewerker hoeft niet meer met de hand de hele mailbox en netwerkschijven te doorlopen. We moeten van hem of haar natuurlijk wel de gevoeligheden weten uit het dossier: zijn er lopende rechtszaken of onderhandelingen te verwachten? Maar de medewerker heeft niet meer de neiging om uit het raam te springen. Want de reguliere Woo voelt vaak als een strafcorvee en is zeker niet leuk om als ambtenaar op je bureau te krijgen. Je moet vaak alles met de hand doen en het is een taak die je naast je reguliere werk moet oppakken. Bij de Groningse aanpak snijdt het mes echt aan twee kanten. Het maakt het werk leuker.ā
RELEVANTE TREFFERS
Het derde kenmerkende punt in de aanpak was het gebruik van slimme zoektermen. Nat gaf al het voorbeeld van het IPO en het woord energie. āHet is juist die vertaling in overleg met de indiener die bepaalt hoe er wordt gezocht. Kijk naar het verzoek en stel jezelf de vraag wat de kern is van jouw beoordeling. Dan wijs je woorden aan die erin zitten, en dat zijn precies de trefwoorden die je ook gebruikt om te zoeken. Doordat je digitaal zoekt maak je het proces ook een stuk efficiĆ«nter. In een mailbox zitten duizenden e-mailtjes, bijlagen, documenten, alles erop en eraan. Als je daar met de hand doorheen zou moeten word je gek. Het juist toepassen van een of meerdere trefwoorden is in mijn ogen heel slim. Doordat je digitaal de bron bevraagt, krijg je alleen de relevante treffers voorgeschoteld.ā
AI NOG GEEN OPTIE
Natuurlijk wordt Nat ook geholpen door de modernste IT-tools, maar kunstmatige intelligentie is voor hem nog geen optie. āIk gebruik zelf altijd als voorbeeld deze zin: meneer Dijk graaft in een dijk en krijgt een dwangsom opgelegd van mevrouw Dijk, dijkgraaf bij het waterschap. Daarin zitten zoveel ādijkenā dat AI over het algemeen daarin de weg redelijk snel kwijtraakt. Ik heb gemerkt dat het erg lastig is om met AI correct onderscheid te maken tussen wat nu een persoonsgegeven is en wat personen zijn die uit hoofde van hun functie in de openbaarheid treden. Want dit zijn ook gewoon persoonsgegevens, maar wel een andere categorie. Die moet je namelijk niet lakken.
Dat onderscheid kun je AI op zich laten maken door haar heel veel te trainen. Maar dan nog. We hebben hier bijvoorbeeld eens een ambtenaar en een gedeputeerde gehad die allebei dezelfde voornaam hadden en ook nog binnen hetzelfde dossier vielen. Dan moet je al helemaal in het dossier zitten om te weten welke persoon er nou wordt bedoeld. Daar gaat geen AI jou in ondersteunen. Het fijne van trefwoorden is dat āhet erin voorkomt of nietā en dat het toetsbaar is.ā
GROEN OPLICHTEN
Nat gebruikt het systeem ZyLAB voor het hele Woo-proces. āDat betekent naast lakken, verzamelen, ordenen, sorteren, ontdubbelen en mailconversaties bouwen ook keyword highlights toepassen. Mensen die uit hoofde van hun functie in de openbaarheid treden laat je groen oprichten. Zo zie je tijdens het beoordelen wie wie is. We kunnen ook met echt geavanceerde tooling aan de gang als het gaat om bedrijfsvertrouwelijke getallen, telefoonnummers, bankrekening- en BSN-nummers.ā
SAMENWERKEN
Faciliteer digitaal gebruiksgemak, zei Nat al toen hij in 2011 bij de provincie begon met data van bruggen en sluizen. āIk kijk naar de indiener en kan laten zien wat er is, welke trefwoorden zijn gebruikt en hoeveel documenten daaruit rollen. En naar de medewerker heb ik een goed verhaal als het gaat om het ontzorgen. Dat maakt dat zoān Woo-verzoek gewoon een leuk onderwerp kan zijn. Het mooie vind ik dat de aanpak van samenwerking met de indiener de laatste tijd ook wordt ondersteund met een aantal uitspraken van rechtbanken. Die samenwerking is echt een wezenlijk onderdeel van de Woo.ā
> Het artikel over een andere winnaar bij de Victorines 2024, Thomas Tan (scriptieprijs), lees je hier. <
Platform Authentieke Journalistiek/PAJ (dat dit jaar verdergaat onder de naam Momus) besloot in 2018 een Wob-verzoek te doen met als doel om de verwevenheid tussen de Nederlandse overheid en Royal Dutch Shell te onderzoeken. Follow the Money (FTM), RTV Noord en RTV Drenthe haakten al snel aan bij het project dat Shell Papers is gaan heten. In 2019 namen de provincies Groningen en Drenthe en de gemeenten Groningen en Assen het verzoek direct in behandeling, dit in tegenstelling tot het ministerie van EZ. In 2020 openbaarde de gemeente Assen documenten, en de gemeente Drenthe deed dat in 2022. Tussendoor vocht PAJ onder meer de weigering van de provincie Zuid-Holland aan bij de rechter. Een tijdlijn van en meer achtergrond over de Shell Papers vind je hier.
SHELL PAPERS
IP | vakblad voor informatieprofessionals | 01 / 2025
ZOEKEN EN VINDEN MAARTEN HAFKAMP
Bij de Victorines eind vorig jaar sleepte Robert Nat, dataspecialist bij de provincie Groningen, een eervolle vermelding in de wacht voor zijn datagedreven aanpak van Woo-verzoeken. Hij wist daarmee efficiĆ«nt relevante documenten op te leveren aan journalisten voor de zogeheten Shell Papers. āAl snel bleek dat je als informatie-/dataspecialist toch wel erg handig bent met de wat complexere zoekvragen.ā
Onderzoeksjournalisten van PAJ, FTM, RTV Noord en RTV Drenthe dienden in 2019 een uitgebreid verzoek in bij het ministerie van Economische Zaken (EZ) en de provincie Groningen in het kader van de Wet open overheid (Woo), met als doel de banden tussen Shell en de Nederlandse overheid te onderzoeken ā ook wel de Shell Papers genoemd. Diverse ministeries, waaronder het ministerie van EZ, weigerden het verzoek in behandeling te nemen. Maar āzijnā provincie is hier niet in meegegaan, zegt Robert Nat, die een bepalende rol speelde in het verzoek. Hij ontwikkelde een methode om snel grote aantallen documenten te doorzoeken. āDe Groningse aanpak als datagedreven afhandeling van de Woo-verzoekenā, omschrijft hij het. āDe provincies Groningen en Drenthe en de gemeenten Groningen en Assen vonden dat ze het zich niet konden veroorloven om dezelfde houding aan te nemen als de andere bestuursorganen. Dus wij waren van begin af aan overtuigd dat we gewoon moesten leveren.ā
DOMINANTERE ROL
Nat werd als informatieanalist gekoppeld aan het Woo-verzoek Shell Papers en de voorbereiding van de parlementaire enquĆŖte aardgaswinning in Groningen. āAl snel bleek dat je als informatie-/dataspecialist toch wel erg handig bent met grote hoeveelheden documenten en de wat complexere zoekvragen. In eerste instantie vroegen ze me om als verbinder te dienen tussen de afdeling ICT en de projectgroep. Ik merkte echter al snel dat ik met mijn data-achtergrond een dominantere rol kon spelen binnen zoān projectteam. Ik kon het voor iedereen eenvoudiger maken: voor zowel de indieners als onze medewerkers.ā
VEEL OVERLEG OVER QUERY
Hoe zag zijn aanpak eruit? āWe hebben heel veel overlegd met de indieners over de query, de combinatie van trefwoorden waarmee relevante documenten gevonden moesten wordenā, legt hij uit. āDat is een behoorlijk uitgebreide combinatie van trefwoorden geworden, inclusief verwijzingen naar hoe je omgaat met bijvoorbeeld datumbereik van het hoofdstuk. Dat is dus aan de kant van de indiener. Aan de datakant heb ik vooral met onze functioneel beheerders van de diverse applicaties overlegd: hoe gaan we nou deze query afvuren op onze systemen? We hebben er toen voor gekozen om het simpel te houden en elk trefwoord apart af te vuren. Dan haal je weliswaar veel te veel documenten op, maar je weet in ieder geval zeker dat het genoeg is.ā
Naast veel āafvalā krijg je ook nieuwe inzichten, weet hij. āEen daarvan was een simpele: het woord āenergieā. De indieners wilden weten wat het Interprovinciaal Overleg (IPO) op het gebied van energie allemaal aan het doen was. Daarbij bleek dat het IPO in documenten vooral steeds sprak over āheel veel energie stekenā in allerlei zaken. Daar kwamen we dus niet verder mee, en we hebben de informatie echt op een andere manier moeten ophalen.ā
āSHELLā IN DE NAAM
Er waren drie belangrijke kenmerken van de Groningse aanpak. Het eerste was werken vanuit een gemeenschappelijk belang. Nat: āDe Groningse aanpak is vooral heel transparant richting de indiener, omdat je in overleg bepaalt welke trefwoorden relevant zijn voor de vertaling van het Woo-verzoek zoals dat op papier staat. Daardoor kun je ook goed aangeven welke systemen zullen worden bevraagd en welke trefwoorden daarbij gaan worden gebruikt.ā
Je kunt zo eenvoudig aantonen dat bepaalde bronnen zijn bevraagd, wat de gebruikte trefwoorden zijn en wat het aantal documenten is dat je initieel boven water hebt gehaald, stelt hij. āDaar moet dan nog wel een zoekslag overheen. Bij de Shell Papers was het voor de indieners lastig om aan te geven wat ze wilden hebben, maar wat ze nĆet wilden hebben was wel duidelijk. Bijvoorbeeld alles met betrekking tot vuurwerkvergunningen, want daar zit ook āshellā in. Of de bouw van tanks ten behoeve van de chemische industrie, want die hebben een āinner shellā en āouter shellā. Risicoberekeningen bevatten ook āshellā in de naam van het bestand. En er waren factuurlijsten waarin de NAM en de Shell als tankstation voorkwamen. Deze documenten waren allemaal niet relevant. Op deze manier kun je veel transparanter te werk gaan. Het gebruik van trefwoorden haalt eigenlijk het volledige blackboxgedeelte eraf.ā
ONTZORGEN MEDEWERKER
Het tweede kenmerk van de aanpak was: neem contact op met de verzoekers, laat de vraag preciseren en zet de zogeheten āvertrouwelijke voorinzageā in. Zo help je de indiener, maar het ontzorgen van de medewerker is voor Nat nog veel leuker, vertelt hij. āWij geven precies aan wat we nodig hebben en de medewerker hoeft niet meer met de hand de hele mailbox en netwerkschijven te doorlopen. We moeten van hem of haar natuurlijk wel de gevoeligheden weten uit het dossier: zijn er lopende rechtszaken of onderhandelingen te verwachten? Maar de medewerker heeft niet meer de neiging om uit het raam te springen. Want de reguliere Woo voelt vaak als een strafcorvee en is zeker niet leuk om als ambtenaar op je bureau te krijgen. Je moet vaak alles met de hand doen en het is een taak die je naast je reguliere werk moet oppakken. Bij de Groningse aanpak snijdt het mes echt aan twee kanten. Het maakt het werk leuker.ā
RELEVANTE TREFFERS
Het derde kenmerkende punt in de aanpak was het gebruik van slimme zoektermen. Nat gaf al het voorbeeld van het IPO en het woord energie. āHet is juist die vertaling in overleg met de indiener die bepaalt hoe er wordt gezocht. Kijk naar het verzoek en stel jezelf de vraag wat de kern is van jouw beoordeling. Dan wijs je woorden aan die erin zitten, en dat zijn precies de trefwoorden die je ook gebruikt om te zoeken. Doordat je digitaal zoekt maak je het proces ook een stuk efficiĆ«nter. In een mailbox zitten duizenden e-mailtjes, bijlagen, documenten, alles erop en eraan. Als je daar met de hand doorheen zou moeten word je gek. Het juist toepassen van een of meerdere trefwoorden is in mijn ogen heel slim. Doordat je digitaal de bron bevraagt, krijg je alleen de relevante treffers voorgeschoteld.ā
AI NOG GEEN OPTIE
Natuurlijk wordt Nat ook geholpen door de modernste IT-tools, maar kunstmatige intelligentie is voor hem nog geen optie. āIk gebruik zelf altijd als voorbeeld deze zin: meneer Dijk graaft in een dijk en krijgt een dwangsom opgelegd van mevrouw Dijk, dijkgraaf bij het waterschap. Daarin zitten zoveel ādijkenā dat AI over het algemeen daarin de weg redelijk snel kwijtraakt. Ik heb gemerkt dat het erg lastig is om met AI correct onderscheid te maken tussen wat nu een persoonsgegeven is en wat personen zijn die uit hoofde van hun functie in de openbaarheid treden. Want dit zijn ook gewoon persoonsgegevens, maar wel een andere categorie. Die moet je namelijk niet lakken.
Dat onderscheid kun je AI op zich laten maken door haar heel veel te trainen. Maar dan nog. We hebben hier bijvoorbeeld eens een ambtenaar en een gedeputeerde gehad die allebei dezelfde voornaam hadden en ook nog binnen hetzelfde dossier vielen. Dan moet je al helemaal in het dossier zitten om te weten welke persoon er nou wordt bedoeld. Daar gaat geen AI jou in ondersteunen. Het fijne van trefwoorden is dat āhet erin voorkomt of nietā en dat het toetsbaar is.ā
GROEN OPLICHTEN
Nat gebruikt het systeem ZyLAB voor het hele Woo-proces. āDat betekent naast lakken, verzamelen, ordenen, sorteren, ontdubbelen en mailconversaties bouwen ook keyword highlights toepassen. Mensen die uit hoofde van hun functie in de openbaarheid treden laat je groen oprichten. Zo zie je tijdens het beoordelen wie wie is. We kunnen ook met echt geavanceerde tooling aan de gang als het gaat om bedrijfsvertrouwelijke getallen, telefoonnummers, bankrekening- en BSN-nummers.ā
SAMENWERKEN
Faciliteer digitaal gebruiksgemak, zei Nat al toen hij in 2011 bij de provincie begon met data van bruggen en sluizen. āIk kijk naar de indiener en kan laten zien wat er is, welke trefwoorden zijn gebruikt en hoeveel documenten daaruit rollen. En naar de medewerker heb ik een goed verhaal als het gaat om het ontzorgen. Dat maakt dat zoān Woo-verzoek gewoon een leuk onderwerp kan zijn. Het mooie vind ik dat de aanpak van samenwerking met de indiener de laatste tijd ook wordt ondersteund met een aantal uitspraken van rechtbanken. Die samenwerking is echt een wezenlijk onderdeel van de Woo.ā
> Het artikel over een andere winnaar bij de Victorines 2024, Thomas Tan (scriptieprijs), lees je hier. <
Robert Nat
Platform Authentieke Journalistiek/PAJ (dat dit jaar verdergaat onder de naam Momus) besloot in 2018 een Wob-verzoek te doen met als doel om de verwevenheid tussen de Nederlandse overheid en Royal Dutch Shell te onderzoeken. Follow the Money (FTM), RTV Noord en RTV Drenthe haakten al snel aan bij het project dat Shell Papers is gaan heten. In 2019 namen de provincies Groningen en Drenthe en de gemeenten Groningen en Assen het verzoek direct in behandeling, dit in tegenstelling tot het ministerie van EZ. In 2020 openbaarde de gemeente Assen documenten, en de gemeente Drenthe deed dat in 2022. Tussendoor vocht PAJ onder meer de weigering van de provincie Zuid-Holland aan bij de rechter. Een tijdlijn van en meer achtergrond over de Shell Papers vind je hier.
SHELL PAPERS
IP | vakblad voor informatieprofessionals | 01 / 2025