Dit zijn de drie grootste verschillen tussen taalmodellen en chatbots

Non-profitorganisaties TNO, NFI en SURF hebben inmiddels bijna een jaar geleden de krachten gebundeld om GPT-NL te ontwikkelen. In deze periode is er veel gebeurd. Dit najaar duiken we aan de hand van een reeks artikelen in de achtergrond en context van GPT-NL. We schetsen de stappen die we nemen om uiteindelijk een transparant, eerlijk en controleerbaar taalmodel te ontwikkelen waarmee Nederland wordt voorbereid op de toekomst.

LLMs en Chatbots

Iedereen die wel eens met AI ‘praat’, vraagt het zich wel eens af: hoe begrijpt AI eigenlijk wat ik zeg? Hoe herkent hij mijn taal? In dit artikel leggen we je uit hoe dit werkt. Daarbij is het belangrijk het verschil te snappen tussen een taalmodel en een chatbot.

In een eerder artikel legden we uit wat een taalmodel is: een geavanceerd AI-model dat getraind is op grote hoeveelheden tekst om bestaande content te begrijpen en om content genereren.

De onderliggende technologie die maakt dat taalmodellen menselijke output genereren, zijn Generative Pretrained Transfomers, afgekort tot GPT. ‘Generatief’ houdt in dat het model nieuwe content creëert (ofwel: genereert) op basis van input dat het model eerder heeft gezien (of wel: pretrained) aan de hand van ‘transformers’ (een familie van modellen binnen AI). Dankzij deze modellen kan een taalmodel ‘menselijke’ taal begrijpen en nabootsen.

Taalmodellen kunnen voor verschillende functies worden ingezet, zoals het samenvatten van informatie of versimpelen van teksten, of voor het nabootsen van conversaties. Afhankelijk van de nodige functie(s), kan de juiste applicatie op het taalmodel worden gebouwd. In veel gevallen lijkt deze applicatie op een chat-omgeving. Doordat het taalmodel onze taal lijkt te ‘begrijpen’, kunnen gebruikers met het systeem ‘praten’ om van deze functies gebruik te maken.

Om deze reden worden chatbots en taalmodellen vaak door elkaar gehaald, maar ze zijn dus niet hetzelfde: GPT is de onderliggende technologie, de chatbot is de applicatie die daar bovenop is gebouwd. Met GPT-NL verwijzen we dus naar het taalmodel dat we bouwen, en zo heeft ChatGPT haar naam aan het onderliggende model te danken. ChatGPT is dus een applicatie die door generatieve AI wordt aangestuurd, en daarom voor veel verschillende taken kan worden ingezet. Zoals een tekst versimpelen, vertalen, je boodschappenlijstje afmaken, of een songtekst schrijven.

Belangrijkste verschillen tussen taalmodellen en chatbots

Niet elke chatbot wordt aangestuurd door AI. Chatbots kunnen ook op regels gebaseerd zijn of een specifiek script volgen. In tegenstelling tot taalmodellen worden chatbots over het algemeen ontworpen voor een gericht doel, zoals klantenservice of procesondersteuning. Een chatbot is erop gericht vragen van gebruikers in begrijpelijke taal te beantwoorden. Denk bijvoorbeeld aan de automatische chatfuncties van bijvoorbeeld een webshop.

We zoomen nu wat verder in op die belangrijkste verschillen tussen taalmodellen en chatbots.

  1. Doel en functionaliteit
    Taalmodellen zijn ontworpen als generalisten. Ze kunnen een breed scala aan taken uitvoeren die verder gaan dan alleen chatten. Denk aan het opstellen van essays, het vertalen van tekst of zelfs het schrijven van een gedicht.
    Chatbots zijn juist specialisten, gebouwd voor specifieke functies, zoals het beantwoorden van veelgestelde vragen of het begeleiden van gebruikers door een proces.
  2. Trainingsgegevens en reikwijdte:
    Taalmodellen worden getraind op een enorme hoeveelheid data die meerdere talen en soorten inhoud omvat. Deze uitgebreide training stelt een taalmodel in staat tekst in verschillende talen, waaronder het Nederlands, te begrijpen en te genereren.
    Chatbots worden over het algemeen getraind op beperktere gegevens die relevant zijn voor hun specifieke taak.
  3. Flexibiliteit in gesprekken
    Taalmodellen kunnen zich, dankzij hun brede training, aanpassen aan verschillende onderwerpen en gesprekken over een scala aan onderwerpen voeren. Ze kunnen met gemak onvoorspelbare dialogen aan.
    Aan de andere kant volgen chatbots meestal een meer gestructureerde aanpak en kunnen ze moeite hebben als gesprekken afwijken van de verwachte stroom of het geprogrammeerde script.

Conclusie: kies de juiste tool voor de taak

Hoewel zowel taalmodellen als chatbots waardevolle AI-tools zijn, dienen ze verschillende doelen. Chatbots zijn meer geschikt voor specifieke, repetitieve taken binnen gedefinieerde parameters. Taalmodellen zijn daarentegen, met hun brede en meertalige capaciteiten, ideaal voor uiteenlopende en dynamische taken. Het begrijpen van deze verschillen stelt je in staat de juiste AI-technologie voor je doel te kiezen.