Trend 2 – Deugdelijke data worden nog belangrijker
Kunstmatige of artificiële intelligentie is het vermogen van een computersysteem om van zijn omgeving te leren. De term machinelearning hoorde je vast al waaien. AI leert uit ervaringen en stuurt zichzelf bij op basis van feedback uit de omgeving of van de gebruiker. Het oogst wat we met zijn allen zaaiden, dus.
Helaas is niet alle informatie waarmee zo’n systeem zich voedt helemaal accuraat.
De data waarmee AI wordt getraind bevatten hier en daar onjuistheden. Neem nu GenAI-modellen als ChatGPT. Ook daar sluipt onbewust én bewust verkeerde informatie in.
Onbewust?
Stel dat Galileo Galilei in de 16de eeuw aan ChatGPT gevraagd zou hebben of de aarde rond de zon draait, dan zou de chatbot dat ontkend hebben. De meeste tijdsgenoten van Galilei wisten namelijk niet beter.
En AI-tools hebben nu eenmaal de neiging om de algemene consensus te versterken, terwijl een kritische schrijver net dingen in vraag hoort te stellen.
Bewust?
Volgens het Global Risk Report 2024 van het World Economic Forum (WEF) wordt desinformatie de komende twee jaar het grootste risico voor onze mondiale samenleving.
Het klopt daarmee andere weinig heuglijke toppers als extreme weersomstandigheden, cyberonveiligheid, gewapende conflicten, inflatie en sociale polarisatie. De experts van het WEF zien twee hoofdredenen: het succes van populistische politici én … generatieve AI.
Uiteraard is een combinatie van beide – populistische politici die generatieve AI misbruiken om mensen op het verkeerde been en naar hun hand te zetten – extra dramatisch. Zeker als je weet dat fake news tot zes keer sneller rondgaat dan echt nieuws, volgens een studie van het Massachusetts Institute of Technology.
Kwaliteit boven kwantiteit
Ook als je je eigen ‘customised’ AI-tools gaat trainen, komt het erop aan je systeem te voeden met deugdelijke data. Stop je er rommel in, dan komt er onvermijdelijk rommel uit.
Wees bijgevolg secuur en superstreng in je rol als gatekeeper: welk data mag erin en welke niet? Kwantiteit is uiteraard van tel voor trainingmodellen, maar kwaliteit is nog veel belangrijker.
Focus enkel op gegevens die én relevant én betrouwbaar zijn en investeer in het beheer ervan, want dat zal morgen bepalen hoe snel je kunt schakelen en opschalen.