KB nationale bibliotheek: dataprovider én launching customer

Deze maand zijn we gestart met een nieuwe feasibility study in samenwerking met de KB nationale bibliotheek. De KB is een van onze launching partners en heeft rechtenvrije data beschikbaar gesteld voor de doorontwikkeling ervan. Vanaf 1 juni 2026 startten beide partijen een onderzoek dat onder meer inzage moet geven in mogelijke gebruikstoepassingen van GPT-NL voor de KB.

De KB is niet alleen launching customer maar ook data provider van GPT-NL. De nationale bibliotheek heeft teksten uit het publieke domein met GPT-NL heeft gedeeld voor de ontwikkeling van het taalmodel. Het gaat dan om rechtenvrij, Nederlands geschreven erfgoed dat de KB in beheer heeft. De KB is op die manier al vanaf 2024 betrokken bij de Content Board, de belangenvertegenwoordiging van data providers. Vanuit de Content Board kunnen dataproviders meedenken over de toekomst van GPT-NL en inzet in de praktijk.

Betrouwbare informatie

“Die inspraak vinden we als nationale bibliotheek om twee redenen heel belangrijk", licht Niek Schroten, CIO van de KB toe. "We juichen het toe dat er een verantwoord, Nederlands alternatief komt voor de bestaande commerciële aanbieders. Er is een AI-model nodig voor de Nederlandse taal en context, die op basis van kwalitatief hoogwaardige data betrouwbare informatie levert aan gebruikers. Als KB dragen we er graag aan bij dat GPT-NL uiteindelijk onderdeel wordt van een hoogwaardig en pluriform data-ecosysteem.”

Volgens Schroten is de ontwikkeling van verantwoorde AI zelfs noodzakelijk voor het vergroten van democratische weerbaarheid: “We hebben de vrije toegang tot betrouwbare informatie nodig om vrije meningsvorming te kunnen garanderen. Juist nu AI zich in rap tempo ontwikkelt, moeten we actief de betrouwbaarheid van trainingsdata bewaken.”

Eerlijke behandeling

De tweede reden waarom de KB de samenwerking met GPT-NL is aangegaan is omdat beide partijen belang hechten aan het gebruik van rechtmatig verkregen data. Schroten: “Als nationale bibliotheek, die het geschreven erfgoed van Nederlandse makers beheert, vinden wij het belangrijk dat rechthebbenden een redelijke vergoeding krijgen voor het gebruik van hun werk. Bronnen moeten herleidbaar blijven en bij de ontwikkeling van nieuwe technologie moeten auteursrechthebbenden eerlijk worden behandeld. Bekende commerciële AI-tools hebben bijvoorbeeld ongevraagd gebruik gemaakt van data waar auteursrechten op rusten. Daar zijn wij op tegen.”

Dataset Delpher als studiemateriaal

De feasibility study die deze maand start, moet meer inzicht geven in het toepassen van GPT-NL binnen het collectiezoeksysteem van de KB. Er wordt daarbij onderzocht of een RAG-assistent (Retrieval Augmented Generation) gebruikers beter kan bedienen bij hun zoekvragen binnen een specifiek deel van de KB-collectie. Voor deze studie wordt gebruikt gemaakt van de rechtenvrije dataset (materiaal dat ouder is dan 140 jaar) van het KB-platform Delpher.nl.

Schroten: “We hebben er bewust voor gekozen om voor deze studie data uit onze collectie kranten, boeken en tijdschriften te gebruiken waar geen auteursrechten meer op rusten. Het idee is dat het haalbaarheidsonderzoek aan twee kanten lessen oplevert. De resultaten van de studie moet GPT-NL meer leren over het type antwoorden dat haar taalmodel geeft, en de KB meer over toekomstige dienstverleningsmogelijkheden.’

De feasibility study zal lopen tot medio november van dit jaar. Lees meer over onze andere feasibility studies en launching customers op deze pagina.