ZOEKEN EN VINDEN      MAARTEN HAFKAMP

Maarten Hafkamp
Freelance journalist, schrijver en scenarioschrijver

Eervolle vermelding
voor
Robert Nat
Samen zoeken
met slimme
zoektermen

Bij de Victorines eind vorig jaar sleepte Robert Nat, dataspecialist bij de provincie Groningen, een eervolle vermelding in de wacht voor zijn datagedreven aanpak van Woo-verzoeken. Hij wist daarmee efficiĆ«nt relevante documenten op te leveren aan journalisten voor de zogeheten Shell Papers. ā€˜Al snel bleek dat je als informatie-/dataspecialist toch wel erg handig bent met de wat complexere zoekvragen.’

Robert Nat

ā€˜De aanpak van samenwerking met de indiener wordt de laatste tijd ook ondersteund met een aantal uitspraken van rechtbanken’

ā€˜De reguliere Woo voelt vaak als een strafcorvee en is zeker niet leuk om als ambtenaar op je bureau te krijgen’

ā€˜Ik merkte al snel dat ik met mijn data-achtergrond een dominantere rol kon spelen binnen het projectteam’

ā€˜De provincies Groningen en Drenthe en de gemeenten Groningen en Assen waren van begin af aan overtuigd dat ze gewoon moesten leveren’

Onderzoeksjournalisten van PAJ, FTM, RTV Noord en RTV Drenthe dienden in 2019 een uitgebreid verzoek in bij het ministerie van Economische Zaken (EZ) en de provincie Groningen in het kader van de Wet open overheid (Woo), met als doel de banden tussen Shell en de Nederlandse overheid te onderzoeken – ook wel de Shell Papers genoemd. Diverse ministeries, waaronder het ministerie van EZ, weigerden het verzoek in behandeling te nemen. Maar ā€˜zijn’ provincie is hier niet in meegegaan, zegt Robert Nat, die een bepalende rol speelde in het verzoek. Hij ontwikkelde een methode om snel grote aantallen documenten te doorzoeken. ā€˜De Groningse aanpak als datagedreven afhandeling van de Woo-verzoeken’, omschrijft hij het. ā€˜De provincies Groningen en Drenthe en de gemeenten Groningen en Assen vonden dat ze het zich niet konden veroorloven om dezelfde houding aan te nemen als de andere bestuursorganen. Dus wij waren van begin af aan overtuigd dat we gewoon moesten leveren.’

DOMINANTERE ROL
Nat werd als informatieanalist gekoppeld aan het Woo-verzoek Shell Papers en de voorbereiding van de parlementaire enquĆŖte aardgaswinning in Groningen. ā€˜Al snel bleek dat je als informatie-/dataspecialist toch wel erg handig bent met grote hoeveelheden documenten en de wat complexere zoekvragen. In eerste instantie vroegen ze me om als verbinder te dienen tussen de afdeling ICT en de projectgroep. Ik merkte echter al snel dat ik met mijn data-achtergrond een dominantere rol kon spelen binnen zo’n projectteam. Ik kon het voor iedereen eenvoudiger maken: voor zowel de indieners als onze medewerkers.’

VEEL OVERLEG OVER QUERY
Hoe zag zijn aanpak eruit? ā€˜We hebben heel veel overlegd met de indieners over de query, de combinatie van trefwoorden waarmee relevante documenten gevonden moesten worden’, legt hij uit. ā€˜Dat is een behoorlijk uitgebreide combinatie van trefwoorden geworden, inclusief verwijzingen naar hoe je omgaat met bijvoorbeeld datumbereik van het hoofdstuk. Dat is dus aan de kant van de indiener. Aan de datakant heb ik vooral met onze functioneel beheerders van de diverse applicaties overlegd: hoe gaan we nou deze query afvuren op onze systemen? We hebben er toen voor gekozen om het simpel te houden en elk trefwoord apart af te vuren. Dan haal je weliswaar veel te veel documenten op, maar je weet in ieder geval zeker dat het genoeg is.’ 

Naast veel ā€˜afval’ krijg je ook nieuwe inzichten, weet hij. ā€˜Een daarvan was een simpele: het woord ā€œenergieā€. De indieners wilden weten wat het Interprovinciaal Overleg (IPO) op het gebied van energie allemaal aan het doen was. Daarbij bleek dat het IPO in documenten vooral steeds sprak over ā€œheel veel energie stekenā€ in allerlei zaken. Daar kwamen we dus niet verder mee, en we hebben de informatie echt op een andere manier moeten ophalen.’

ā€˜SHELL’ IN DE NAAM
Er waren drie belangrijke kenmerken van de Groningse aanpak. Het eerste was werken vanuit een gemeenschappelijk belang. Nat: ā€˜De Groningse aanpak is vooral heel transparant richting de indiener, omdat je in overleg bepaalt welke trefwoorden relevant zijn voor de vertaling van het Woo-verzoek zoals dat op papier staat. Daardoor kun je ook goed aangeven welke systemen zullen worden bevraagd en welke trefwoorden daarbij gaan worden gebruikt.’

Je kunt zo eenvoudig aantonen dat bepaalde bronnen zijn bevraagd, wat de gebruikte trefwoorden zijn en wat het aantal documenten is dat je initieel boven water hebt gehaald, stelt hij. ā€˜Daar moet dan nog wel een zoekslag overheen. Bij de Shell Papers was het voor de indieners lastig om aan te geven wat ze wilden hebben, maar wat ze nĆ­et wilden hebben was wel duidelijk. Bijvoorbeeld alles met betrekking tot vuurwerkvergunningen, want daar zit ook ā€œshellā€ in. Of de bouw van tanks ten behoeve van de chemische industrie, want die hebben een ā€œinner shellā€ en ā€œouter shellā€. Risicoberekeningen bevatten ook ā€œshellā€ in de naam van het bestand. En er waren factuurlijsten waarin de NAM en de Shell als tankstation voorkwamen. Deze documenten waren allemaal niet relevant. Op deze manier kun je veel transparanter te werk gaan. Het gebruik van trefwoorden haalt eigenlijk het volledige blackboxgedeelte eraf.’

ONTZORGEN MEDEWERKER
Het tweede kenmerk van de aanpak was: neem contact op met de verzoekers, laat de vraag preciseren en zet de zogeheten ā€˜vertrouwelijke voorinzage’ in. Zo help je de indiener, maar het ontzorgen van de medewerker is voor Nat nog veel leuker, vertelt hij. ā€˜Wij geven precies aan wat we nodig hebben en de medewerker hoeft niet meer met de hand de hele mailbox en netwerkschijven te doorlopen. We moeten van hem of haar natuurlijk wel de gevoeligheden weten uit het dossier: zijn er lopende rechtszaken of onderhandelingen te verwachten? Maar de medewerker heeft niet meer de neiging om uit het raam te springen. Want de reguliere Woo voelt vaak als een strafcorvee en is zeker niet leuk om als ambtenaar op je bureau te krijgen. Je moet vaak alles met de hand doen en het is een taak die je naast je reguliere werk moet oppakken. Bij de Groningse aanpak snijdt het mes echt aan twee kanten. Het maakt het werk leuker.’

RELEVANTE TREFFERS
Het derde kenmerkende punt in de aanpak was het gebruik van slimme zoektermen. Nat gaf al het voorbeeld van het IPO en het woord energie. ā€˜Het is juist die vertaling in overleg met de indiener die bepaalt hoe er wordt gezocht. Kijk naar het verzoek en stel jezelf de vraag wat de kern is van jouw beoordeling. Dan wijs je woorden aan die erin zitten, en dat zijn precies de trefwoorden die je ook gebruikt om te zoeken. Doordat je digitaal zoekt maak je het proces ook een stuk efficiĆ«nter. In een mailbox zitten duizenden e-mailtjes, bijlagen, documenten, alles erop en eraan. Als je daar met de hand doorheen zou moeten word je gek. Het juist toepassen van een of meerdere trefwoorden is in mijn ogen heel slim. Doordat je digitaal de bron bevraagt, krijg je alleen de relevante treffers voorgeschoteld.’

AI NOG GEEN OPTIE
Natuurlijk wordt Nat ook geholpen door de modernste IT-tools, maar kunstmatige intelligentie is voor hem nog geen optie. ā€˜Ik gebruik zelf altijd als voorbeeld deze zin: meneer Dijk graaft in een dijk en krijgt een dwangsom opgelegd van mevrouw Dijk, dijkgraaf bij het waterschap. Daarin zitten zoveel ā€œdijkenā€ dat AI over het algemeen daarin de weg redelijk snel kwijtraakt. Ik heb gemerkt dat het erg lastig is om met AI correct onderscheid te maken tussen wat nu een persoonsgegeven is en wat personen zijn die uit hoofde van hun functie in de openbaarheid treden. Want dit zijn ook gewoon persoonsgegevens, maar wel een andere categorie. Die moet je namelijk niet lakken.

Dat onderscheid kun je AI op zich laten maken door haar heel veel te trainen. Maar dan nog. We hebben hier bijvoorbeeld eens een ambtenaar en een gedeputeerde gehad die allebei dezelfde voornaam hadden en ook nog binnen hetzelfde dossier vielen. Dan moet je al helemaal in het dossier zitten om te weten welke persoon er nou wordt bedoeld. Daar gaat geen AI jou in ondersteunen. Het fijne van trefwoorden is dat ā€œhet erin voorkomt of nietā€ en dat het toetsbaar is.’

GROEN OPLICHTEN
Nat gebruikt het systeem ZyLAB voor het hele Woo-proces. ā€˜Dat betekent naast lakken, verzamelen, ordenen, sorteren, ontdubbelen en mailconversaties bouwen ook keyword highlights toepassen. Mensen die uit hoofde van hun functie in de openbaarheid treden laat je groen oprichten. Zo zie je tijdens het beoordelen wie wie is. We kunnen ook met echt geavanceerde tooling aan de gang als het gaat om bedrijfsvertrouwelijke getallen, telefoonnummers, bankrekening- en BSN-nummers.’

SAMENWERKEN
Faciliteer digitaal gebruiksgemak, zei Nat al toen hij in 2011 bij de provincie begon met data van bruggen en sluizen. ā€˜Ik kijk naar de indiener en kan laten zien wat er is, welke trefwoorden zijn gebruikt en hoeveel documenten daaruit rollen. En naar de medewerker heb ik een goed verhaal als het gaat om het ontzorgen. Dat maakt dat zo’n Woo-verzoek gewoon een leuk onderwerp kan zijn. Het mooie vind ik dat de aanpak van samenwerking met de indiener de laatste tijd ook wordt ondersteund met een aantal uitspraken van rechtbanken. Die samenwerking is echt een wezenlijk onderdeel van de Woo.’ 

> Het artikel over een andere winnaar bij de Victorines 2024, Thomas Tan (scriptieprijs), lees je hier. <

Platform Authentieke Journalistiek/PAJ (dat dit jaar verdergaat onder de naam Momus) besloot in 2018 een Wob-verzoek te doen met als doel om de verwevenheid tussen de Nederlandse overheid en Royal Dutch Shell te onderzoeken. Follow the Money (FTM), RTV Noord en RTV Drenthe haakten al snel aan bij het project dat Shell Papers is gaan heten. In 2019 namen de provincies Groningen en Drenthe en de gemeenten Groningen en Assen het verzoek direct in behandeling, dit in tegenstelling tot het ministerie van EZ. In 2020 openbaarde de gemeente Assen documenten, en de gemeente Drenthe deed dat in 2022. Tussendoor vocht PAJ onder meer de weigering van de provincie Zuid-Holland aan bij de rechter. Een tijdlijn van en meer achtergrond over de Shell Papers vind je hier.

SHELL PAPERS

IP | vakblad voor informatieprofessionals | 01 / 2025

Maarten Hafkamp
Freelance journalist, schrijver en scenarioschrijver

voor
Eervolle vermelding
Robert Nat
met slimme
zoektermen
Samen zoeken

ZOEKEN EN VINDEN      MAARTEN HAFKAMP

Bij de Victorines eind vorig jaar sleepte Robert Nat, dataspecialist bij de provincie Groningen, een eervolle vermelding in de wacht voor zijn datagedreven aanpak van Woo-verzoeken. Hij wist daarmee efficiĆ«nt relevante documenten op te leveren aan journalisten voor de zogeheten Shell Papers. ā€˜Al snel bleek dat je als informatie-/dataspecialist toch wel erg handig bent met de wat complexere zoekvragen.’

Onderzoeksjournalisten van PAJ, FTM, RTV Noord en RTV Drenthe dienden in 2019 een uitgebreid verzoek in bij het ministerie van Economische Zaken (EZ) en de provincie Groningen in het kader van de Wet open overheid (Woo), met als doel de banden tussen Shell en de Nederlandse overheid te onderzoeken – ook wel de Shell Papers genoemd. Diverse ministeries, waaronder het ministerie van EZ, weigerden het verzoek in behandeling te nemen. Maar ā€˜zijn’ provincie is hier niet in meegegaan, zegt Robert Nat, die een bepalende rol speelde in het verzoek. Hij ontwikkelde een methode om snel grote aantallen documenten te doorzoeken. ā€˜De Groningse aanpak als datagedreven afhandeling van de Woo-verzoeken’, omschrijft hij het. ā€˜De provincies Groningen en Drenthe en de gemeenten Groningen en Assen vonden dat ze het zich niet konden veroorloven om dezelfde houding aan te nemen als de andere bestuursorganen. Dus wij waren van begin af aan overtuigd dat we gewoon moesten leveren.’

DOMINANTERE ROL
Nat werd als informatieanalist gekoppeld aan het Woo-verzoek Shell Papers en de voorbereiding van de parlementaire enquĆŖte aardgaswinning in Groningen. ā€˜Al snel bleek dat je als informatie-/dataspecialist toch wel erg handig bent met grote hoeveelheden documenten en de wat complexere zoekvragen. In eerste instantie vroegen ze me om als verbinder te dienen tussen de afdeling ICT en de projectgroep. Ik merkte echter al snel dat ik met mijn data-achtergrond een dominantere rol kon spelen binnen zo’n projectteam. Ik kon het voor iedereen eenvoudiger maken: voor zowel de indieners als onze medewerkers.’

VEEL OVERLEG OVER QUERY
Hoe zag zijn aanpak eruit? ā€˜We hebben heel veel overlegd met de indieners over de query, de combinatie van trefwoorden waarmee relevante documenten gevonden moesten worden’, legt hij uit. ā€˜Dat is een behoorlijk uitgebreide combinatie van trefwoorden geworden, inclusief verwijzingen naar hoe je omgaat met bijvoorbeeld datumbereik van het hoofdstuk. Dat is dus aan de kant van de indiener. Aan de datakant heb ik vooral met onze functioneel beheerders van de diverse applicaties overlegd: hoe gaan we nou deze query afvuren op onze systemen? We hebben er toen voor gekozen om het simpel te houden en elk trefwoord apart af te vuren. Dan haal je weliswaar veel te veel documenten op, maar je weet in ieder geval zeker dat het genoeg is.’ 

Naast veel ā€˜afval’ krijg je ook nieuwe inzichten, weet hij. ā€˜Een daarvan was een simpele: het woord ā€œenergieā€. De indieners wilden weten wat het Interprovinciaal Overleg (IPO) op het gebied van energie allemaal aan het doen was. Daarbij bleek dat het IPO in documenten vooral steeds sprak over ā€œheel veel energie stekenā€ in allerlei zaken. Daar kwamen we dus niet verder mee, en we hebben de informatie echt op een andere manier moeten ophalen.’

ā€˜SHELL’ IN DE NAAM
Er waren drie belangrijke kenmerken van de Groningse aanpak. Het eerste was werken vanuit een gemeenschappelijk belang. Nat: ā€˜De Groningse aanpak is vooral heel transparant richting de indiener, omdat je in overleg bepaalt welke trefwoorden relevant zijn voor de vertaling van het Woo-verzoek zoals dat op papier staat. Daardoor kun je ook goed aangeven welke systemen zullen worden bevraagd en welke trefwoorden daarbij gaan worden gebruikt.’

Je kunt zo eenvoudig aantonen dat bepaalde bronnen zijn bevraagd, wat de gebruikte trefwoorden zijn en wat het aantal documenten is dat je initieel boven water hebt gehaald, stelt hij. ā€˜Daar moet dan nog wel een zoekslag overheen. Bij de Shell Papers was het voor de indieners lastig om aan te geven wat ze wilden hebben, maar wat ze nĆ­et wilden hebben was wel duidelijk. Bijvoorbeeld alles met betrekking tot vuurwerkvergunningen, want daar zit ook ā€œshellā€ in. Of de bouw van tanks ten behoeve van de chemische industrie, want die hebben een ā€œinner shellā€ en ā€œouter shellā€. Risicoberekeningen bevatten ook ā€œshellā€ in de naam van het bestand. En er waren factuurlijsten waarin de NAM en de Shell als tankstation voorkwamen. Deze documenten waren allemaal niet relevant. Op deze manier kun je veel transparanter te werk gaan. Het gebruik van trefwoorden haalt eigenlijk het volledige blackboxgedeelte eraf.’

ONTZORGEN MEDEWERKER
Het tweede kenmerk van de aanpak was: neem contact op met de verzoekers, laat de vraag preciseren en zet de zogeheten ā€˜vertrouwelijke voorinzage’ in. Zo help je de indiener, maar het ontzorgen van de medewerker is voor Nat nog veel leuker, vertelt hij. ā€˜Wij geven precies aan wat we nodig hebben en de medewerker hoeft niet meer met de hand de hele mailbox en netwerkschijven te doorlopen. We moeten van hem of haar natuurlijk wel de gevoeligheden weten uit het dossier: zijn er lopende rechtszaken of onderhandelingen te verwachten? Maar de medewerker heeft niet meer de neiging om uit het raam te springen. Want de reguliere Woo voelt vaak als een strafcorvee en is zeker niet leuk om als ambtenaar op je bureau te krijgen. Je moet vaak alles met de hand doen en het is een taak die je naast je reguliere werk moet oppakken. Bij de Groningse aanpak snijdt het mes echt aan twee kanten. Het maakt het werk leuker.’

RELEVANTE TREFFERS
Het derde kenmerkende punt in de aanpak was het gebruik van slimme zoektermen. Nat gaf al het voorbeeld van het IPO en het woord energie. ā€˜Het is juist die vertaling in overleg met de indiener die bepaalt hoe er wordt gezocht. Kijk naar het verzoek en stel jezelf de vraag wat de kern is van jouw beoordeling. Dan wijs je woorden aan die erin zitten, en dat zijn precies de trefwoorden die je ook gebruikt om te zoeken. Doordat je digitaal zoekt maak je het proces ook een stuk efficiĆ«nter. In een mailbox zitten duizenden e-mailtjes, bijlagen, documenten, alles erop en eraan. Als je daar met de hand doorheen zou moeten word je gek. Het juist toepassen van een of meerdere trefwoorden is in mijn ogen heel slim. Doordat je digitaal de bron bevraagt, krijg je alleen de relevante treffers voorgeschoteld.’

AI NOG GEEN OPTIE
Natuurlijk wordt Nat ook geholpen door de modernste IT-tools, maar kunstmatige intelligentie is voor hem nog geen optie. ā€˜Ik gebruik zelf altijd als voorbeeld deze zin: meneer Dijk graaft in een dijk en krijgt een dwangsom opgelegd van mevrouw Dijk, dijkgraaf bij het waterschap. Daarin zitten zoveel ā€œdijkenā€ dat AI over het algemeen daarin de weg redelijk snel kwijtraakt. Ik heb gemerkt dat het erg lastig is om met AI correct onderscheid te maken tussen wat nu een persoonsgegeven is en wat personen zijn die uit hoofde van hun functie in de openbaarheid treden. Want dit zijn ook gewoon persoonsgegevens, maar wel een andere categorie. Die moet je namelijk niet lakken.

Dat onderscheid kun je AI op zich laten maken door haar heel veel te trainen. Maar dan nog. We hebben hier bijvoorbeeld eens een ambtenaar en een gedeputeerde gehad die allebei dezelfde voornaam hadden en ook nog binnen hetzelfde dossier vielen. Dan moet je al helemaal in het dossier zitten om te weten welke persoon er nou wordt bedoeld. Daar gaat geen AI jou in ondersteunen. Het fijne van trefwoorden is dat ā€œhet erin voorkomt of nietā€ en dat het toetsbaar is.’

GROEN OPLICHTEN
Nat gebruikt het systeem ZyLAB voor het hele Woo-proces. ā€˜Dat betekent naast lakken, verzamelen, ordenen, sorteren, ontdubbelen en mailconversaties bouwen ook keyword highlights toepassen. Mensen die uit hoofde van hun functie in de openbaarheid treden laat je groen oprichten. Zo zie je tijdens het beoordelen wie wie is. We kunnen ook met echt geavanceerde tooling aan de gang als het gaat om bedrijfsvertrouwelijke getallen, telefoonnummers, bankrekening- en BSN-nummers.’

SAMENWERKEN
Faciliteer digitaal gebruiksgemak, zei Nat al toen hij in 2011 bij de provincie begon met data van bruggen en sluizen. ā€˜Ik kijk naar de indiener en kan laten zien wat er is, welke trefwoorden zijn gebruikt en hoeveel documenten daaruit rollen. En naar de medewerker heb ik een goed verhaal als het gaat om het ontzorgen. Dat maakt dat zo’n Woo-verzoek gewoon een leuk onderwerp kan zijn. Het mooie vind ik dat de aanpak van samenwerking met de indiener de laatste tijd ook wordt ondersteund met een aantal uitspraken van rechtbanken. Die samenwerking is echt een wezenlijk onderdeel van de Woo.’ 

> Het artikel over een andere winnaar bij de Victorines 2024, Thomas Tan (scriptieprijs), lees je hier. <

Robert Nat

Platform Authentieke Journalistiek/PAJ (dat dit jaar verdergaat onder de naam Momus) besloot in 2018 een Wob-verzoek te doen met als doel om de verwevenheid tussen de Nederlandse overheid en Royal Dutch Shell te onderzoeken. Follow the Money (FTM), RTV Noord en RTV Drenthe haakten al snel aan bij het project dat Shell Papers is gaan heten. In 2019 namen de provincies Groningen en Drenthe en de gemeenten Groningen en Assen het verzoek direct in behandeling, dit in tegenstelling tot het ministerie van EZ. In 2020 openbaarde de gemeente Assen documenten, en de gemeente Drenthe deed dat in 2022. Tussendoor vocht PAJ onder meer de weigering van de provincie Zuid-Holland aan bij de rechter. Een tijdlijn van en meer achtergrond over de Shell Papers vind je hier.

SHELL PAPERS

IP | vakblad voor informatieprofessionals | 01 / 2025