Taalmodellen zijn onmisbaar voor opsporingswerk, dat is al jaren zo. De analyse van terabytes aan bewijsmateriaal is een gigantische opgave. Het is voor forensisch experts praktisch onmogelijk zulke grote datavolumes snel te doorgronden. Zo kreeg het NFI de afgelopen jaren te maken met gigantische hoeveelheden data uit gekraakte chatdiensten zoals EncroChat, Sky ECC en Exclu. Een ander voorbeeld: in het Europese Horizon 2020-project Exfiles hielp het NFI mee bij het analyseren van duizenden in beslag genomen telefoons. Eerder kwam al eens naar buiten dat het NFI en de politie taalmodel ‘Bert’ gebruikten om crimineel jargon te herkennen en dreigberichten te detecteren. Maar er is dus meer nodig.
Erwin, neem ons eens verder mee in de uitdagingen?
‘Het klopt dat criminelen hun communicatie steeds meer vercijferen en nog steeds versluierend taalgebruik gebruiken. Het is een voortdurende uitdaging voor forensisch onderzoekers om deze ontwikkelingen bij te houden en effectieve methoden te ontwikkelen voor het ontcijferen van versleutelde en versluierende taal. Elke uitvoeringsorganisatie heeft niet de middelen om zelf een compleet taalmodel te ontwikkelen. Een taalmodel zoals GPT-NL kan daarin een waardevolle bijdrage leveren en gebruik maken van onze data, algoritmes en expertise.’
Kan je die inzet van GPT-NL voor forensisch onderzoek en in de rechtspraak nog wat meer duiden?
‘Het gaat ons niet alleen om de data of het model zelf, maar vooral om transparantie. Die transparantie is cruciaal voor ons werk, zeker ook in de rechtszaal. In het forensisch onderzoek moeten we exact kunnen uitleggen hoe we tot een bepaalde conclusie zijn gekomen. Waarom vinden wij bijvoorbeeld dat een stem in een opname past bij een verdachte? Of waarom detecteert een taalmodel een bepaald bericht als levensbedreigend? Met commerciële modellen van big tech kunnen we dat niet altijd met zekerheid zeggen, omdat we niet weten hoe ze precies getraind zijn of welke data erin zit. GPT-NL kan die transparantie wél bieden.’
‘We gebruiken al taalmodellen om bijvoorbeeld dreigberichten te herkennen. Dat is tekstgebaseerd en dus anders dan gesproken taal. Maar het is extra complex, omdat criminelen zoals aangegeven steeds meer vercijferen en versluierend communiceren en vaak straattaal gebruiken. De publieke datasets die beschikbaar zijn, bevatten nauwelijks straattaal en al helemaal geen geheime criminele codes. Daarom hebben we een extreem goed taalmodel nodig dat helpt om dat kleine beetje relevante tekst effectief te analyseren.’
‘Daarnaast speelt dialectherkenning een grote rol. Hoe beter een taalmodel dialecten begrijpt, hoe beter wij kunnen analyseren of een bepaalde uitspraak van dezelfde persoon afkomstig is. Net zoals een Nederlander die Engels spreekt vaak herkend kan worden aan zinsopbouw en accenten, verraadt dialect vaak een regionale herkomst. Hoe beter ons model dit begrijpt, hoe sterker onze forensische analyse wordt.’

Afbeelding © NFI
‘Ik wil bloed zien’ of: ‘Doe een kogel in zijn hoofd’. Het zijn voorbeelden van berichten die via Encrochat verstuurd werden. Criminelen waanden zich veilig op de server, maar niets bleek minder waar. De politie kon veel berichten meelezen. Ze wilden berichten met een bedreiging er zo snel mogelijk uithalen om mishandelingen, ontvoeringen en liquidaties te voorkomen. Het Nederlands Forensisch Instituut (NFI) heeft daarom een model ontwikkeld om de politie te helpen voorspellen welke berichten een serieuze bedreiging bevatten.
Hoe draagt AI in bredere zin bij aan het werk van forensisch onderzoekers?
‘AI helpt ons op verschillende manieren. Een belangrijk aspect is snelheid: mensen kunnen onmogelijk de enorme hoeveelheden data analyseren binnen de tijd die we in opsporingsonderzoeken hebben. Daarnaast helpt AI om onze onderzoekers te beschermen tegen traumatiserende inhoud. Dit is breder dan alleen taalmodellen, maar het laat wel zien hoe AI in forensisch werk een essentiële rol speelt. We gebruiken AI vooral ter ondersteuning, waarbij er altijd nog een mens meekijkt.’
‘Dat is meteen het grote verschil tussen AI voor opsporing en AI als deskundige opinie. In opsporingsonderzoeken mogen er best nog foutmarges in zitten, omdat het gaat om signaleren. Maar in de rechtszaal, waar verklaringen van deskundigen een rol spelen, moeten die foutmarges minimaal zijn. Dat vraagt om volledige controle over hoe de modellen werken en dat kunnen we alleen bereiken met een eigen, transparant Nederlands taalmodel.’
GPT-NL is volop in ontwikkeling. Waar hoop je over een paar jaar op met dit taalmodel en in ons AI-landschap?
‘Dat we GPT-NL in kunnen zetten op plekken waar we nu commerciële modellen gebruiken, maar dan met een kleinere onzekerheidsfactor. Dat we door grotere transparantie een eerlijker en betrouwbaarder systeem hebben, dat uiteindelijk bijdraagt aan betere beslissingen in de rechtszaal. En dat we als Nederland ook breder profiteren van een goed taalmodel. Want forensische toepassingen zijn maar één kant van het verhaal. Ik hoop bijvoorbeeld dat mijn familieleden die op leeftijd zijn straks ook moeiteloos met een chatbot kunnen praten, zelfs als dat in dialect is.’