LINKED OPEN DATA       ANNE VAN DEN DOOL

Lees ook het interview met Jantien Borsboom

Pieter Woltjer

Pieter Woltjer:

Zoektocht
naar voorouders
door linked data 
steeds
makkelijker

De behoefte te weten waar je vandaan komt is zo oud als de weg naar Rome. Dankzij digitalisering wordt het steeds makkelijker informatie van verschillende bronnen aan elkaar te koppelen, waardoor het vinden van je voorouders steeds eenvoudiger wordt. Pieter Woltjer, datamanager bij het CBG | Centrum voor Familiegeschiedenis, vertelt erover in zijn VOGIN-IP-lezing. ‘Iedere Nederlander moet in staat zijn de eigen familiegeschiedenis te leren kennen.’

Paspoortaanvraagkaart van Ivonne Niggebrugge. Indisch Oud-Paspoortarchief. CBG, Den Haag.

Geertruda Maria van Waijenburg, overleden in Amsterdam op 9 februari 1843. CBG Verzameling bidprentjes, Den Haag.

WieWasWie.nl

Over Pieter Woltjer

Pieter Woltjer is datamanager bij het CBG | Centrum voor Familiegeschiedenis. In die rol is hij verantwoordelijk voor de ontwikkeling van PiCo, de nieuwe standaard voor historische persoonsgegevens. Woltjer is historicus en IT’er met ruim vijftien jaar ervaring op het gebied van collectiebeheer en -ontsluiting. Bij zijn vorige werkgever, Picturae, was hij onder meer verantwoordelijk voor de ontwikkeling van het crowdsourcingplatform VeleHanden en van het op linked data gebaseerde collectiebeheersysteem Memorix Nexus.

Het verhaal van Pieter Woltjer live bijwonen? Je kunt nog aanhaken bij de VOGIN-IP-lezing, het evenement voor informatieprofessionals over zoeken en vinden op 18 april in de Openbare Bibliotheek Amsterdam (OBA).

> Het volledige programmaoverzicht vind je op vogin-ip-lezing.net.

> De VOGIN-IP-lezing is het gezamenlijke evenement van Stichting VOGIN en magazine IP. Dit jaar vindt de twaalfde editie plaats, de vorige was op 16 maart 2023.

Pieter Woltjer

Waar kom ik vandaan? Het lijkt alsof mensen vandaag de dag meer dan ooit bezig zijn met die vraag. In televisieprogramma’s gaan bekende en minder bekende Nederlanders op pad om hun stamboom uit te stippelen; op internet kan iedereen een pakket bestellen waarmee het eigen DNA onder de loep kan worden genomen.

Aan de andere kant: willen weten wie onze voorouders waren, is van alle tijden, weet ook Pieter Woltjer, datamanager bij het CBG. ‘Vroeger vergde dit veel meer geduld. Een genealoog moest in eindeloos veel studiezaaltjes van archieven struinen op zoek naar de juiste informatie. Wanneer je voorouders altijd op één plek hebben gewoond, blijft de zoektocht overzichtelijk, maar als een van je voorouders is verhuisd naar een andere stad of dorp, moet je meerdere puzzelstukjes bij elkaar leggen. Ook dat kwam altijd al voor: vandaag de dag verhuizen mensen de hele wereld over, maar wie vroeger in Oost-Groningen woonde, zoals mijn eigen familie, trouwde net zo makkelijk met een Duitse vlak over de grens.’

VAN PAPIER NAAR DIGITAAL
Waar al die informatie zich ooit alleen maar op papier bevond, kun je als onderzoeker vandaag de dag terecht in digitale databases. Elk archief biedt zijn historische persoonsgegevens aan op de website. En op het platform WieWasWie.nl zijn al die gegevens in een keer doorzoekbaar. Dat is allerminst vanzelfsprekend, benadrukt Woltjer. ‘Om dat voor elkaar te krijgen, moet je allemaal dezelfde standaard gebruiken. Wanneer instellingen informatie verschillend labelen, zoals de geboortedatum of woonplaats, lukt het niet om gegevens te koppelen.’

Het CBG speelt een centrale rol in het uitpluizen van stambomen, met name via de website WieWasWie.nl. Honderden websitebezoekers maken dagelijks gebruik van de mogelijkheden om op een centrale plek te zoeken naar informatie over hun voorouders: van geboorte- tot sterfdatum, van beroep tot plaats van trouwen. Met al die aktes en andere documentatie in de hand ontstaat een levendig beeld van het leven dat iemand, soms wel eeuwen geleden, moet hebben geleid.

Om die zoektocht voor iedereen zo makkelijk mogelijk te maken, is het CBG continu bezig om zijn diensten te verbeteren. Dat gaat niet alleen om het bij elkaar brengen van zo veel mogelijk bronnen, maar ook om het aantrekkelijk presenteren van al die data. Denk bijvoorbeeld aan het tonen van afbeeldingen van aktes, waardoor je meer informatie krijgt dan alleen een geboortedatum of -plaats. Niet voor niets luidt de missie van het CBG dat iedere Nederlander in staat moet zijn de eigen familiegeschiedenis te leren kennen.

VERNIEUWING AAN DE ACHTERKANT
Om stappen te kunnen blijven zetten in de zo overzichtelijk mogelijke presentatie van al die data, moeten aan de achterkant continu vernieuwingen plaatsvinden. Een van die innovaties is de ontwikkeling van PiCo, afkorting voor Persons in Context. PiCo is een nieuwe standaard voor historische persoonsgegevens die het CBG heeft ontwikkeld. De overstap naar deze standaard is nodig om alle bronnen over onze voorouders bij elkaar te brengen, aldus Woltjer. ‘WieWasWie bestaat nu ongeveer tien jaar. Toentertijd is het gebouwd op de A2A (Access to Archives)-standaard. A2A was toe aan vernieuwing, want binnen deze standaard is het niet mogelijk alle verbindingen tussen informatie te leggen zoals we dat graag willen.’

Daarom stapt het CBG nu over op PiCo, dat voldoet aan de meest recente standaarden op het gebied van linked data. ‘Binnen ons nieuwe systeem koppelen we data op een zo gestructureerd mogelijke manier aan elkaar, waardoor informatie nog meer betekenis krijgt’, legt Woltjer uit. ‘Dat doen we niet alleen voor onszelf. Binnen de erfgoedsector wordt het gebruik van linked data sterk gestimuleerd, onder meer door het Netwerk Digitaal Erfgoed. Zo kunnen we als erfgoedinstellingen nog beter met elkaar samenwerken.’

Het CBG heeft PiCo niet op eigen houtje ontwikkeld: het is tot stand gekomen in samenwerking met een groep inhoudelijke en technische experts. Een eerste versie is ter review voorgelegd aan een brede groep van erfgoedinstellingen. Die waren enthousiast. ‘Een standaard is pas een standaard als zo veel mogelijk mensen ermee werken’, benadrukt Woltjer.

VERMELDING EN RECONSTRUCTIE
De belangrijkste vernieuwing binnen het nieuwe systeem van het CBG is het onderscheid tussen een persoonsvermelding en een persoonsreconstructie. ‘Dat eerste deden we al jaren: wanneer je op een bepaalde naam zocht, presenteerden we in onze database een overzicht van allerlei gegevens. Het resultaat was een lijst met soms wel duizenden namen waar je zelf de juiste persoon uit moest vissen. Met een persoonsreconstructie werkt het andersom: op basis van verschillende gegevens creëren we één unieke persoon aan wie we op basis van al die verschillende documenten ouders, kinderen, een geboorteplaats en een geboortedatum kunnen toewijzen. Dat is veel gebruiksvriendelijker. Wij doen een deel van het zoekwerk voor je.’ 

Het klinkt als een logische manier van presenteren. Toch bestond deze systematiek nog niet. ‘Het is eigenlijk bizar dat er nog geen standaard was voor historische persoonsgegevens’, aldus Woltjer. ‘Voor levende personen is die er wel, maar bij het beschrijven van historische personen komen andere vragen kijken. Op oude aktes staat soms bijvoorbeeld alleen een leeftijd, waardoor je niet precies weet wanneer iemand geboren is.’

Met Persons in Context sluit het CBG aan bij de meest gangbare linked open data-standaard ter wereld, Schema.org geheten. Dat maakt samenwerking over de grens nog makkelijker. ‘We hebben ook al positieve reacties uit het buitenland ontvangen, en we hopen dat PiCo ook buiten Nederland gaat worden gebruikt.’

SPEURPLEZIER
Met het maken van persoonsreconstructies neem het CBG een deel van het speurplezier weg, weet Woltjer. ‘Het is een hobby die veel mensen met groot plezier uitoefenen, maar gelukkig blijft er nog genoeg te doen. Niet de kale feiten maken zo’n onderzoek het meest interessant maar de verhalen erachter. Waarom verhuisde iemand van de ene plek naar de andere? Welke paden bewandelden de kinderen? Hoe zag het leven er in die tijd uit? Een stamboom is niet het einddoel, maar een kapstok waaraan je die verhalen kunt ophangen. Met onze hulpmiddelen maken we het onderzoek minder saai en zorgen we dat iemand sneller de diepte in kan.’

Woltjer ziet nu al dat de nieuwe systematiek aanslaat, zowel bij archief- als bij onderzoeksinstellingen. ‘Ook onze collega’s zien de mogelijkheden van deze aanpak en zijn direct met dit systeem aan de slag gegaan. Persons in Context is in eerste instantie bedoeld voor genealogische bronnen, maar net als andere linked data-standaarden is het uit te breiden voor andere doeleinden, zoals demografisch onderzoek of onderzoek naar het slavernijverleden. Dit is hoe je linked data moet inzetten, hoor ik vaak.’ <

‘Binnen ons nieuwe systeem koppelen we data op een zo gestructureerd mogelijke manier aan elkaar, waardoor informatie nog meer betekenis krijgt’

‘Het is eigenlijk bizar dat er nog geen standaard was voor historische persoonsgegevens. Voor levende personen is die er wel’

‘Met onze hulpmiddelen maken we het onderzoek minder saai en zorgen we dat iemand sneller de diepte in kan’

IP | vakblad voor informatieprofessionals | 03 / 2023

LINKED OPEN DATA       ANNE VAN DEN DOOL

Lees ook het interview met Jantien Borsboom

Pieter Woltjer

Pieter Woltjer:

Zoektocht
makkelijker
naar voorouders
door linked data 
steeds

De behoefte te weten waar je vandaan komt is zo oud als de weg naar Rome. Dankzij digitalisering wordt het steeds makkelijker informatie van verschillende bronnen aan elkaar te koppelen, waardoor het vinden van je voorouders steeds eenvoudiger wordt. Pieter Woltjer, datamanager bij het CBG | Centrum voor Familiegeschiedenis, vertelt erover in zijn VOGIN-IP-lezing. ‘Iedere Nederlander moet in staat zijn de eigen familiegeschiedenis te leren kennen.’

Voor meer beeld 

Het verhaal van Pieter Woltjer live bijwonen? Je kunt nog aanhaken bij de VOGIN-IP-lezing, het evenement voor informatieprofessionals over zoeken en vinden op 18 april in de Openbare Bibliotheek Amsterdam (OBA).

> Het volledige programmaoverzicht vind je op vogin-ip-lezing.net.

> De VOGIN-IP-lezing is het gezamenlijke evenement van Stichting VOGIN en magazine IP. Dit jaar vindt de twaalfde editie plaats, de vorige was op 16 maart 2023.

IP | vakblad voor informatieprofessionals | 03 / 2023

Pieter Woltjer

Over Pieter Woltjer

Pieter Woltjer is datamanager bij het CBG | Centrum voor Familiegeschiedenis. In die rol is hij verantwoordelijk voor de ontwikkeling van PiCo, de nieuwe standaard voor historische persoonsgegevens. Woltjer is historicus en IT’er met ruim vijftien jaar ervaring op het gebied van collectiebeheer en -ontsluiting. Bij zijn vorige werkgever, Picturae, was hij onder meer verantwoordelijk voor de ontwikkeling van het crowdsourcingplatform VeleHanden en van het op linked data gebaseerde collectiebeheersysteem Memorix Nexus.

Waar kom ik vandaan? Het lijkt alsof mensen vandaag de dag meer dan ooit bezig zijn met die vraag. In televisieprogramma’s gaan bekende en minder bekende Nederlanders op pad om hun stamboom uit te stippelen; op internet kan iedereen een pakket bestellen waarmee het eigen DNA onder de loep kan worden genomen.

Aan de andere kant: willen weten wie onze voorouders waren, is van alle tijden, weet ook Pieter Woltjer, datamanager bij het CBG. ‘Vroeger vergde dit veel meer geduld. Een genealoog moest in eindeloos veel studiezaaltjes van archieven struinen op zoek naar de juiste informatie. Wanneer je voorouders altijd op één plek hebben gewoond, blijft de zoektocht overzichtelijk, maar als een van je voorouders is verhuisd naar een andere stad of dorp, moet je meerdere puzzelstukjes bij elkaar leggen. Ook dat kwam altijd al voor: vandaag de dag verhuizen mensen de hele wereld over, maar wie vroeger in Oost-Groningen woonde, zoals mijn eigen familie, trouwde net zo makkelijk met een Duitse vlak over de grens.’

VAN PAPIER NAAR DIGITAAL
Waar al die informatie zich ooit alleen maar op papier bevond, kun je als onderzoeker vandaag de dag terecht in digitale databases. Elk archief biedt zijn historische persoonsgegevens aan op de website. En op het platform WieWasWie.nl zijn al die gegevens in een keer doorzoekbaar. Dat is allerminst vanzelfsprekend, benadrukt Woltjer. ‘Om dat voor elkaar te krijgen, moet je allemaal dezelfde standaard gebruiken. Wanneer instellingen informatie verschillend labelen, zoals de geboortedatum of woonplaats, lukt het niet om gegevens te koppelen.’

Het CBG speelt een centrale rol in het uitpluizen van stambomen, met name via de website WieWasWie.nl. Honderden websitebezoekers maken dagelijks gebruik van de mogelijkheden om op een centrale plek te zoeken naar informatie over hun voorouders: van geboorte- tot sterfdatum, van beroep tot plaats van trouwen. Met al die aktes en andere documentatie in de hand ontstaat een levendig beeld van het leven dat iemand, soms wel eeuwen geleden, moet hebben geleid.

Om die zoektocht voor iedereen zo makkelijk mogelijk te maken, is het CBG continu bezig om zijn diensten te verbeteren. Dat gaat niet alleen om het bij elkaar brengen van zo veel mogelijk bronnen, maar ook om het aantrekkelijk presenteren van al die data. Denk bijvoorbeeld aan het tonen van afbeeldingen van aktes, waardoor je meer informatie krijgt dan alleen een geboortedatum of -plaats. Niet voor niets luidt de missie van het CBG dat iedere Nederlander in staat moet zijn de eigen familiegeschiedenis te leren kennen.

VERNIEUWING AAN DE ACHTERKANT
Om stappen te kunnen blijven zetten in de zo overzichtelijk mogelijke presentatie van al die data, moeten aan de achterkant continu vernieuwingen plaatsvinden. Een van die innovaties is de ontwikkeling van PiCo, afkorting voor Persons in Context. PiCo is een nieuwe standaard voor historische persoonsgegevens die het CBG heeft ontwikkeld. De overstap naar deze standaard is nodig om alle bronnen over onze voorouders bij elkaar te brengen, aldus Woltjer. ‘WieWasWie bestaat nu ongeveer tien jaar. Toentertijd is het gebouwd op de A2A (Access to Archives)-standaard. A2A was toe aan vernieuwing, want binnen deze standaard is het niet mogelijk alle verbindingen tussen informatie te leggen zoals we dat graag willen.’

Daarom stapt het CBG nu over op PiCo, dat voldoet aan de meest recente standaarden op het gebied van linked data. ‘Binnen ons nieuwe systeem koppelen we data op een zo gestructureerd mogelijke manier aan elkaar, waardoor informatie nog meer betekenis krijgt’, legt Woltjer uit. ‘Dat doen we niet alleen voor onszelf. Binnen de erfgoedsector wordt het gebruik van linked data sterk gestimuleerd, onder meer door het Netwerk Digitaal Erfgoed. Zo kunnen we als erfgoedinstellingen nog beter met elkaar samenwerken.’

Het CBG heeft PiCo niet op eigen houtje ontwikkeld: het is tot stand gekomen in samenwerking met een groep inhoudelijke en technische experts. Een eerste versie is ter review voorgelegd aan een brede groep van erfgoedinstellingen. Die waren enthousiast. ‘Een standaard is pas een standaard als zo veel mogelijk mensen ermee werken’, benadrukt Woltjer.

VERMELDING EN RECONSTRUCTIE
De belangrijkste vernieuwing binnen het nieuwe systeem van het CBG is het onderscheid tussen een persoonsvermelding en een persoonsreconstructie. ‘Dat eerste deden we al jaren: wanneer je op een bepaalde naam zocht, presenteerden we in onze database een overzicht van allerlei gegevens. Het resultaat was een lijst met soms wel duizenden namen waar je zelf de juiste persoon uit moest vissen. Met een persoonsreconstructie werkt het andersom: op basis van verschillende gegevens creëren we één unieke persoon aan wie we op basis van al die verschillende documenten ouders, kinderen, een geboorteplaats en een geboortedatum kunnen toewijzen. Dat is veel gebruiksvriendelijker. Wij doen een deel van het zoekwerk voor je.’ 

Het klinkt als een logische manier van presenteren. Toch bestond deze systematiek nog niet. ‘Het is eigenlijk bizar dat er nog geen standaard was voor historische persoonsgegevens’, aldus Woltjer. ‘Voor levende personen is die er wel, maar bij het beschrijven van historische personen komen andere vragen kijken. Op oude aktes staat soms bijvoorbeeld alleen een leeftijd, waardoor je niet precies weet wanneer iemand geboren is.’

Met Persons in Context sluit het CBG aan bij de meest gangbare linked open data-standaard ter wereld, Schema.org geheten. Dat maakt samenwerking over de grens nog makkelijker. ‘We hebben ook al positieve reacties uit het buitenland ontvangen, en we hopen dat PiCo ook buiten Nederland gaat worden gebruikt.’

SPEURPLEZIER
Met het maken van persoonsreconstructies neem het CBG een deel van het speurplezier weg, weet Woltjer. ‘Het is een hobby die veel mensen met groot plezier uitoefenen, maar gelukkig blijft er nog genoeg te doen. Niet de kale feiten maken zo’n onderzoek het meest interessant maar de verhalen erachter. Waarom verhuisde iemand van de ene plek naar de andere? Welke paden bewandelden de kinderen? Hoe zag het leven er in die tijd uit? Een stamboom is niet het einddoel, maar een kapstok waaraan je die verhalen kunt ophangen. Met onze hulpmiddelen maken we het onderzoek minder saai en zorgen we dat iemand sneller de diepte in kan.’

Woltjer ziet nu al dat de nieuwe systematiek aanslaat, zowel bij archief- als bij onderzoeksinstellingen. ‘Ook onze collega’s zien de mogelijkheden van deze aanpak en zijn direct met dit systeem aan de slag gegaan. Persons in Context is in eerste instantie bedoeld voor genealogische bronnen, maar net als andere linked data-standaarden is het uit te breiden voor andere doeleinden, zoals demografisch onderzoek of onderzoek naar het slavernijverleden. Dit is hoe je linked data moet inzetten, hoor ik vaak.’ <