Samen bouwen
Voor het trainen van GPT-NL is een enorme hoeveelheid data nodig die divers genoeg is om tot een inclusief en sterk taalmodel te komen. Echter is deze data beperkt beschikbaar. Content providers leveren dan ook waardevolle data, waarmee we GPT-NL breed toepasbaar kunnen maken.
Samen denken
De Content Board is een brede vertegenwoordiging van dataproviders (auteursrechthebbenden) die zelf data aanleveren voor GPT-NL. Vanuit de Content Board hebben zij inspraak over de toekomst van GPT-NL.
Samen delen
Een deel van de opbrengsten zullen terugvloeien naar de content providers. Zo wil GPT-NL auteursrechthebbenden een eerlijke plek geven in de ontwikkeling van technologie.
Van tekst tot trainingsdata
Dit zijn de stappen die de teksten doorlopen wanneer deze ter beschikking worden gesteld voor het trainen van GPT-NL. Omdat GPT-NL een AI-model is, spreken we verder van 'data' in plaats van 'teksten'.
Benieuwd hoe zo'n taalmodel nou eigenlijk werkt? Hier lees je er meer over.