In deze rubriek publiceert IP reacties van lezers op artikelen die in het blad zijn verschenen. Ook reageren? Dat kan via redactie@informatieprofessional.nl.
‘De resultaten zijn waardevol als signaal: de technologische drempels van tien jaar geleden bestaan niet meer in dezelfde vorm’
‘De sector beschikt over decennia aan domeinkennis; die kennis is geen obstakel voor innovatie, maar brandstof ervan’
‘Een infrastructuuridee met echte potentie is de groeiende domeinkennisbank, maar wie is eigenaar van die kennislaag?’
LEZERSREACTIES Ali Aminshahidi
De column van Martijn Aslander in IP #4-2026 stelt een vraag die de archief- en informatiesector al te lang heeft vermeden: wat is een scan eigenlijk waard als de tekst erachter niet klopt? Het onderscheid tussen digitaliseren en informatiseren is scherp geformuleerd en verdient een serieus vervolg. Deze reflectie wil dat vervolg aanzwengelen; niet door de column te weerleggen, maar door de vragen te stellen die een volgende stap mogelijk maken.
VAN RESULTAAT NAAR METHODE
De column beschrijft indrukwekkende resultaten: MI5-documenten verwerkt in minuten, een zeventiende-eeuws kerkregister uitgelezen waar het menselijk oog het opgaf, een character error rate die ver onder het sectorgemiddelde ligt. Die resultaten zijn waardevol als signaal: de technologische drempels van tien jaar geleden bestaan niet meer in dezelfde vorm.
Maar een signaal is nog geen fundament. Wat de sector nodig heeft om op deze aanpak te bouwen is inzicht in de methode achter de resultaten. Welke combinatie van engines levert welk resultaat op welk type materiaal? Waar liggen de grenzen – bij onbekende schrijfhanden, bij beschadigd materiaal, bij documenten waarbij de context ontbreekt? En hoe wordt de output systematisch gevalideerd, ook op gevallen die het systeem niet herkent?
Die vragen zijn geen twijfel aan de resultaten. Ze zijn de voorwaarde om van een veelbelovende aanpak een gedeelde infrastructuur te maken. Onafhankelijke reproductie en toetsing maken het mogelijk om prestaties te vergelijken, verbeteringen door te voeren en vertrouwen op te bouwen. Wat vandaag een succesvolle demonstratie is, kan alleen uitgroeien tot een breed toepasbare voorziening wanneer anderen dezelfde resultaten kunnen verifiëren en reproduceren.
INSTELLINGEN ALS PARTNER, NIET ALS PROBLEEM
De column plaatst de technologische mogelijkheden van vandaag af tegen de traagheid van grote erfgoedinstellingen. Dat contrast is begrijpelijk als retorisch middel, maar verdient nuancering als we het over samenwerking hebben.
Instellingen als de KB, het Nationaal Archief en het NIOD opereren binnen juridische kaders rondom auteursrecht, privacywetgeving en de Archiefwet. Fouten in transcripties van rechtshistorische of persoonsgerelateerde documenten hebben consequenties die verder reiken dan een gemist zoekresultaat. Dat maakt institutionele afwegingen soms traag, maar niet irrationeel – en het maakt die instellingen tot noodzakelijke partners in elke aanpak die duurzaam wil zijn.
Bovendien beschikt de sector over iets wat geen technische pijplijn zelf kan genereren: decennia aan domeinkennis over collecties, periodes, schrijfhanden en historische context. Die kennis is geen obstakel voor innovatie. Het is de brandstof ervan.
DE GOVERNANCEVRAAG
Het meest ambitieuze idee in de column is de groeiende domeinkennisbank – een gedeelde laag met namen, plaatsen, organisaties en vaktermen die per domein werkt in plaats van per instelling. Dat is een infrastructuuridee met echte potentie, juist voor een sector waarin instellingen deels overlappende collecties beheren en vergelijkbare vraagstukken tegenkomen.
Maar infrastructuur vraagt om governance. Wie is eigenaar van die kennislaag? Wie corrigeert fouten wanneer een naam systematisch verkeerd wordt herkend? Wie bepaalt welke domeinen prioriteit krijgen? En hoe wordt voorkomen dat een systeem dat is getraind op goed ontsloten collecties, de al minder zichtbare periodes en gemeenschappen verder naar de achtergrond duwt?
Dit zijn geen argumenten tegen het idee. Het zijn de vragen die beantwoord moeten worden om het idee van een persoonlijk project tot een sectorale voorziening te maken.
TRANSPARANTIE EN HERLEIDBAARHEID
Een aanvullende vraag betreft de herleidbaarheid van verrijkingen en correcties. Wanneer OCR-uitkomsten worden aangepast op basis van context, kennisbanken of kruisverwijzingen met andere bronnen, moet inzichtelijk blijven welke wijziging op welke grond is aangebracht. Voor archiefinstellingen is niet alleen de kwaliteit van de uitkomst van belang, maar ook de mogelijkheid om het proces achter die uitkomst te reconstrueren.
De oorspronkelijke bronlezing, de toegepaste correcties en de gebruikte kennisbronnen moeten controleerbaar blijven. Alleen dan kunnen betrouwbaarheid, authenticiteit en verantwoording hand in hand gaan. Wat voor een onderzoeker een praktische verbetering is, raakt voor een archiefinstelling direct aan vragen van provenance, bewijswaarde en informatiebetrouwbaarheid.
EEN VOORSTEL AAN DE SECTOR
De column sluit af met de vraag welke organisaties als eerste stappen gaan zetten. Die vraag verdient een concreet antwoord vanuit de sector zelf.
Een zinvolle eerste stap zou een open methodepublicatie zijn: een beschrijving van de aanpak die archivarissen, informatieprofessionals en onderzoekers in staat stelt haar te testen op eigen materiaal en de resultaten terug te koppelen. Een tweede stap zou een pilotproject kunnen zijn met één of meerdere instellingen, op een afgebakende collectie, waarbij resultaten transparant worden gedeeld – inclusief de gevallen waarin de methode tekortschoot.
Niet als bewijs dat de sector het fout heeft gedaan, maar als bewijs dat het samen beter kan. De onderzoeker die een naam vindt die anders verborgen bleef, de instelling die haar collectie beter ontsluit, de burger die sneller toegang krijgt tot informatie en de sector die laat zien dat zij in staat is te vernieuwen – dat is een verhaal waar iedereen bij wint.
Het nieuwe hoofdstuk is aangekondigd. De vraag is nu niet óf de sector aan tafel gaat zitten, maar hoe zij ervoor zorgt dat innovatie, betrouwbaarheid en publieke waarde samen het verhaal van dat hoofdstuk gaan schrijven. Want uiteindelijk gaat deze discussie niet alleen over technologie – zij raakt aan de publieke opdracht van erfgoed- en informatie-instellingen: betrouwbare toegang bieden tot informatie, bronnen duurzaam toegankelijk houden en transparant verantwoorden hoe informatie tot stand komt.
Ali Aminshahidi is werkzaam bij de Rijksorganisatie voor Informatiehuishouding (RvIHH). Deze bijdrage is op persoonlijke titel geschreven en vertegenwoordigt niet noodzakelijkerwijs het standpunt van de werkgever. <
IP | vakblad voor informatieprofessionals | 05 / 2026
In deze rubriek publiceert IP reacties van lezers op artikelen die in het blad zijn verschenen. Ook reageren? Dat kan via redactie@informatieprofessional.nl.
LEZERSREACTIES Ali Aminshahidi
De column van Martijn Aslander in IP #4-2026 stelt een vraag die de archief- en informatiesector al te lang heeft vermeden: wat is een scan eigenlijk waard als de tekst erachter niet klopt? Het onderscheid tussen digitaliseren en informatiseren is scherp geformuleerd en verdient een serieus vervolg. Deze reflectie wil dat vervolg aanzwengelen; niet door de column te weerleggen, maar door de vragen te stellen die een volgende stap mogelijk maken.
VAN RESULTAAT NAAR METHODE
De column beschrijft indrukwekkende resultaten: MI5-documenten verwerkt in minuten, een zeventiende-eeuws kerkregister uitgelezen waar het menselijk oog het opgaf, een character error rate die ver onder het sectorgemiddelde ligt. Die resultaten zijn waardevol als signaal: de technologische drempels van tien jaar geleden bestaan niet meer in dezelfde vorm.
Maar een signaal is nog geen fundament. Wat de sector nodig heeft om op deze aanpak te bouwen is inzicht in de methode achter de resultaten. Welke combinatie van engines levert welk resultaat op welk type materiaal? Waar liggen de grenzen – bij onbekende schrijfhanden, bij beschadigd materiaal, bij documenten waarbij de context ontbreekt? En hoe wordt de output systematisch gevalideerd, ook op gevallen die het systeem niet herkent?
Die vragen zijn geen twijfel aan de resultaten. Ze zijn de voorwaarde om van een veelbelovende aanpak een gedeelde infrastructuur te maken. Onafhankelijke reproductie en toetsing maken het mogelijk om prestaties te vergelijken, verbeteringen door te voeren en vertrouwen op te bouwen. Wat vandaag een succesvolle demonstratie is, kan alleen uitgroeien tot een breed toepasbare voorziening wanneer anderen dezelfde resultaten kunnen verifiëren en reproduceren.
INSTELLINGEN ALS PARTNER, NIET ALS PROBLEEM
De column plaatst de technologische mogelijkheden van vandaag af tegen de traagheid van grote erfgoedinstellingen. Dat contrast is begrijpelijk als retorisch middel, maar verdient nuancering als we het over samenwerking hebben.
Instellingen als de KB, het Nationaal Archief en het NIOD opereren binnen juridische kaders rondom auteursrecht, privacywetgeving en de Archiefwet. Fouten in transcripties van rechtshistorische of persoonsgerelateerde documenten hebben consequenties die verder reiken dan een gemist zoekresultaat. Dat maakt institutionele afwegingen soms traag, maar niet irrationeel – en het maakt die instellingen tot noodzakelijke partners in elke aanpak die duurzaam wil zijn.
Bovendien beschikt de sector over iets wat geen technische pijplijn zelf kan genereren: decennia aan domeinkennis over collecties, periodes, schrijfhanden en historische context. Die kennis is geen obstakel voor innovatie. Het is de brandstof ervan.
DE GOVERNANCEVRAAG
Het meest ambitieuze idee in de column is de groeiende domeinkennisbank – een gedeelde laag met namen, plaatsen, organisaties en vaktermen die per domein werkt in plaats van per instelling. Dat is een infrastructuuridee met echte potentie, juist voor een sector waarin instellingen deels overlappende collecties beheren en vergelijkbare vraagstukken tegenkomen.
Maar infrastructuur vraagt om governance. Wie is eigenaar van die kennislaag? Wie corrigeert fouten wanneer een naam systematisch verkeerd wordt herkend? Wie bepaalt welke domeinen prioriteit krijgen? En hoe wordt voorkomen dat een systeem dat is getraind op goed ontsloten collecties, de al minder zichtbare periodes en gemeenschappen verder naar de achtergrond duwt?
Dit zijn geen argumenten tegen het idee. Het zijn de vragen die beantwoord moeten worden om het idee van een persoonlijk project tot een sectorale voorziening te maken.
TRANSPARANTIE EN HERLEIDBAARHEID
Een aanvullende vraag betreft de herleidbaarheid van verrijkingen en correcties. Wanneer OCR-uitkomsten worden aangepast op basis van context, kennisbanken of kruisverwijzingen met andere bronnen, moet inzichtelijk blijven welke wijziging op welke grond is aangebracht. Voor archiefinstellingen is niet alleen de kwaliteit van de uitkomst van belang, maar ook de mogelijkheid om het proces achter die uitkomst te reconstrueren.
De oorspronkelijke bronlezing, de toegepaste correcties en de gebruikte kennisbronnen moeten controleerbaar blijven. Alleen dan kunnen betrouwbaarheid, authenticiteit en verantwoording hand in hand gaan. Wat voor een onderzoeker een praktische verbetering is, raakt voor een archiefinstelling direct aan vragen van provenance, bewijswaarde en informatiebetrouwbaarheid.
EEN VOORSTEL AAN DE SECTOR
De column sluit af met de vraag welke organisaties als eerste stappen gaan zetten. Die vraag verdient een concreet antwoord vanuit de sector zelf.
Een zinvolle eerste stap zou een open methodepublicatie zijn: een beschrijving van de aanpak die archivarissen, informatieprofessionals en onderzoekers in staat stelt haar te testen op eigen materiaal en de resultaten terug te koppelen. Een tweede stap zou een pilotproject kunnen zijn met één of meerdere instellingen, op een afgebakende collectie, waarbij resultaten transparant worden gedeeld – inclusief de gevallen waarin de methode tekortschoot.
Niet als bewijs dat de sector het fout heeft gedaan, maar als bewijs dat het samen beter kan. De onderzoeker die een naam vindt die anders verborgen bleef, de instelling die haar collectie beter ontsluit, de burger die sneller toegang krijgt tot informatie en de sector die laat zien dat zij in staat is te vernieuwen – dat is een verhaal waar iedereen bij wint.
Het nieuwe hoofdstuk is aangekondigd. De vraag is nu niet óf de sector aan tafel gaat zitten, maar hoe zij ervoor zorgt dat innovatie, betrouwbaarheid en publieke waarde samen het verhaal van dat hoofdstuk gaan schrijven. Want uiteindelijk gaat deze discussie niet alleen over technologie – zij raakt aan de publieke opdracht van erfgoed- en informatie-instellingen: betrouwbare toegang bieden tot informatie, bronnen duurzaam toegankelijk houden en transparant verantwoorden hoe informatie tot stand komt.
Ali Aminshahidi is werkzaam bij de Rijksorganisatie voor Informatiehuishouding (RvIHH). Deze bijdrage is op persoonlijke titel geschreven en vertegenwoordigt niet noodzakelijkerwijs het standpunt van de werkgever. <
IP | vakblad voor informatieprofessionals | 05 / 2026