Planning van het project GPT-NL
De uitvoering van GPT-NL bestaat uit twee fases. In het eerste jaar staat de concrete ontwikkeling van het Nederlandse taalmodel centraal, waar ook de academische sector actief zal worden betrokken. In de tweede fase zal het model verder worden aangescherpt door use cases en behoeftes uit de praktijk als inspiratie, en zal er worden gewerkt aan de verdere exploitatie van het model.
Momenteel bevinden wij ons in de Data Acquisitie fase om zoveel mogelijk data te verzamelen waar we GPT-NL op kunnen trainen. Een gedetailleerd overzicht van de processen rondom dataverzameling is te zien in onze 'Data Acquisition Pipeline'. We raden aan deze op desktop te bekijken.
Wanneer we voldoende data binnen hebben om tot een sterk en divers taalmodel te komen, zullen we ons model trainen op een gehost computercluster.
Na de training zal het model verder worden aangescherpt door use cases en behoeftes uit de praktijk als inspiratie, en zal er worden gewerkt aan de verdere exploitatie van het model zodat er verdere verbeteringen, onderhoud en innovaties voor de toekomst mogelijk worden.