Hoe vectoren smaak en waarde toevoegen: AI moet je proeven

Vectoren vertalen de werkelijkheid naar data

Een vector is een weergave van numerieke punten, bijvoorbeeld in een driedimensionaal coördinatensysteem met X, Y en Z. Hiermee kun je diverse berekeningen doen, zoals het bepalen van de afstand naar een restaurant in Amsterdam of welke stad onder de zeespiegel ligt.

In de context van AI kunnen vectoren ook woorden representeren, genaamd embeddings. Embeddings stellen je in staat om betekenissen en semantiek te definiëren. Zo kun je bijvoorbeeld een embedding maken van het smaakprofiel van een gerecht: zout, zoet, bitter, zuur en umami. De waarde van deze nummers wordt bepaald tijdens het trainen van het model. Hiermee kun je het smaakprofiel van recepten vastleggen en die vervolgens onderling vergelijken: welke recepten zijn bijzonder zoet en welke recepten lijken op elkaar?

Met vectoren worden recepten ook in talloze dimensies beschreven, zoals pittigheid, kans op kruimels, textuur, keuken, bereidingstijd, gebruikte ingrediënten, etc. Elke dimensie geeft je de mogelijkheid om verschillende recepten met elkaar te vergelijken of te groeperen. Dit wordt gedaan met de afstand tussen vectoren op de dimensie waarop je zoekt. Deze vectoren worden opgeslagen in een vectordatabase. Hoe meer dimensies je hebt, hoe complexer en specifieker je vectoren kunt vergelijken en groeperen. Het vermogen om een stuk tekst om te kunnen zetten in een vector – en allerlei berekeningen mee doen om bijvoorbeeld zwaartes en synoniemen mee te geven – maakt natuurlijke taalverwerking (natural language processing, NLP) mogelijk.

Combineer je een vectordatabase met een LLM-model zoals ChatGPT, dan kun je bijzonder interessante dingen doen. De voornaamste daarvan is grip krijgen op de data waarmee het LLM-model werkt.

Grip op je data met vectoren

ChatGPT is beperkt met een kennislimiet tot een bepaald tijdstip: GPT 3.5 tot januari 2022 en GPT 4.0 tot april 2023. Gebruikers kunnen weliswaar tijdelijke input geven voor actuele antwoorden, maar het model blijft gebaseerd op gegevens tot die datum. Het bijwerken van het model met nieuwe data is namelijk tijdsintensief en kostbaar: het trainen van het GPT-3 model kostte bijvoorbeeld naar schatting 12 miljoen dollar en het GPT-4 model zelfs meer dan 100 miljoen dollar. De grote vraag is dan hoe je als bedrijf je bedrijfsinformatie toegankelijk kunt maken én actueel houden via een LLM-model zonder deze opnieuw te moeten trainen of finetunen. Het antwoord is door de taken te verdelen. Een LLM-model is feitelijk een slimme bouwsteen voor taal die je overal kunt toevoegen. Een vectordatabase is een losse bouwsteen die je aan een LLM-model kunt koppelen, net als een ‘standaard’ database met bijvoorbeeld productinformatie. Deze combinatie van taken heet retrieval augmented generation (RAG). Op basis van de input haal je voorgeselecteerde informatie op uit de (vector)database, om deze informatie vervolgens te gebruiken met de LLM. De (vector)database kun je actueel bijhouden met bijvoorbeeld de drie meest relevante pagina’s van je website, de laatste energieprijzen of de beschikbaarheid van je producten. Zo houd je niet alleen de data actueel, maar behoud je ook de volledige controle. Daarmee geef je zelf sturing aan het succes van je LLM-model.

De waarde van semantisch zoeken

Vectoren en embeddings maken data begrijpbaar en interpreteerbaar waarmee semantisch zoeken mogelijk wordt. Dit ontsluit allerlei zakelijke toepassingen:

Relevantere antwoorden
Vectoren verbeteren de gebruikerservaring door resultaten en aanbevelingen nauwkeuriger te maken. Google's BERT-model en recommendations engines zoals die van Amazon zijn hier voorbeelden van.
Personalisatie
Aanbevelingen kun je met vectoren ook op individueel niveau toepassen, waardoor personalisatie mogelijk is. Zo kun je content gepersonaliseerd aanbieden, zoals nieuwsartikelen, aanbevelingen voor producten of muziek- en filmaanbevelingen. Denk bijvoorbeeld aan Netflix en Spotify Made for You.
Zoeken op zachte criteria
Vectoren kunnen de manier van zoeken enorm uitbreiden. Een voorbeeld daarvan is een experiment dat we deden voor een woningzoeker, waarbij we vectoren gebruiken om het zoeken op zowel 'harde' als 'zachte' criteria mogelijk te maken. Naast zoeken op prijs, locatie en aantal vierkante meters kun je ook zoeken op afstand tot het dichtstbijzijnde kinderdagverblijf of woningen met een garage én een zwembad.
Sentimentanalyse
Met vectoren kunnen de sentimenten en meningen van gebruikers worden geanalyseerd. E-mails, telefoongesprekken, reviews, social media- en chatberichten kunnen worden geïnterpreteerd op dimensies als blijheid of ontevredenheid, wat waardevolle inzichten kan opleveren voor merkreputatie, klantenservice en productontwikkeling. Maar ook: in hoeverre lijkt een social mediabericht op bekende voorbeelden van abuse?
Conversational chat
Vectoren kunnen ook een verband leggen tussen een chatbericht en veelvoorkomende doelen die gebruikers hebben, zogeheten user intents. Door die intenties snel te identificeren kan een chatbot snel relevante informatie en opties verstrekken die de gebruiker verder helpen.
Kennis toegankelijk maken
Een vectordatabase maakt kennisbanken beter doorzoekbaar waardoor medewerkers en partners snel relevante informatie kunnen vinden. Dit kunnen interne kennisbanken zijn of specifieke werkapplicaties, zoals onze eigen AiO. Medewerkers kunnen hiermee straks vragen gaan stellen over de team workspace Confluence, het CRM en de medewerkersdatabase Who is Who.

Vectoren kunnen overal worden toegepast waar het gaat om interactie met data, informatie en kennis. Uitgebreide tekstuele documentatie, zoals voorwaarden of handleidingen, kun je met vectordatabases ontsluiten om specifieke antwoorden op basis van complexe zoekopdrachten. De veelzijdigheid van vectoren opent de deur naar cruciale informatie, waardoor kennisintensieve organisaties hun operationele processen kunnen optimaliseren en meer waarde toevoegen aan hun diensten.

En het mooie van vectoren? Je kunt ze als organisatie bijzonder snel in de praktijk brengen en meerwaarde creëren.

De vectordatabase in de praktijk brengen

Voor het technische deel heb je iemand nodig met technische kennis van het maken van een simpele applicatie, typisch een developer. Er zijn tegenwoordig veel tools beschikbaar, zowel betaald als onbetaald. Het is een kwestie van tijd vrijmaken en uitproberen. Wat je nodig hebt:

Een LLM-model. Je kunt hiervoor de betaalde SaaS-diensten van OpenAI en Azure OpenAI gebruiken of lokaal een eigen LLM-model draaien, zoals LLaMA 2 van Meta of Mistral uit Frankrijk.
Een vectordatabase. Ook hier zijn betaalde en gratis tools beschikbaar, zoals Pinecone en Weaviate, een Nederlandse open-source startup met serverless, lokaal en cloud als mogelijkheden.

Door een LLM-model te gebruiken dat al getraind is, bespaar je aanzienlijke tijd. OpenAI biedt sinds kort nu ook de laagdrempelige mogelijkheid om zonder coderen een eigen GPT (Generative Pre-trained Transformer) te bouwen. De vectordatabase benader je rechtstreeks via API of via een client van de gekozen oplossing, zoals Pinecone client of Weaviate Client. Na het verbinden van de client, het creëren van een index en het toevoegen van vectoren, kun je al een eerste ‘nearest-neighbour’ zoekactie doen. Deze quickstart met testvectoren kun je volgens Weaviate al in 20 minuten draaiend krijgen. Het toepassen van een vectordatabase is niet uitsluitend een IT-taak. Vanwege de vele toepassingen raakt het gebruik van vectoren en embeddings steeds meer verweven met operationele en commerciële processen van een organisatie. Klanten betere antwoorden online kunnen geven heeft bijvoorbeeld directe gevolgen voor de druk op de klantenafdeling en de klandizie. Neem daarom de toepassing en het creëren van toegevoegde waarde als uitgangspunt.

Best practices voor vectordatabases

Het bedenken en bouwen van een LLM-model wordt steeds gemakkelijker door de beschikbaarheid van GPT’s. OpenAI wil hiermee de creatie van specifieke chatbots stimuleren. Een marktplaats waar je deze chatbots kunt aanbieden en afnemen ligt in het verschiet, wat verdere innovatie en toepassing enorm zal versnellen. Wil je je concurrentie voorblijven? Pas de volgende best practices toe waarmee je maximale waarde met vectordatabases creëert:

De vectordatabase vervangt geen andere databases. Een LLM-model kun je aan allerlei databases koppelen, zoals een productdatabase. Daarmee kun je hele directe antwoorden geven waarvoor je geen semantisch zoeken nodig hebt. Bijvoorbeeld: is deze winterjas ook in maat XXXL beschikbaar? Wat is de beschikbaarheid? Voor zoekopdrachten die betekenis en verbanden zoeken, gebruik je een vectordatabase.
Garbage in, garbage out. De resultaten van een vectordatabase hangen af van de kwaliteit van de data. Die moeten nauwkeurig, goed georganiseerd en adequaat worden omgezet naar vectoren. Het aantal dimensies speelt daarbij een grote rol: hoe meer dimensies je bijvoorbeeld over recepten vastlegt, hoe meer specifieke vragen je kunt beantwoorden. Bijvoorbeeld over de aanwezigheid van gluten of pinda’s. Gebruik daarom alleen kwalitatieve data en zet in op het continu verbeteren ervan.
Vectoren kunnen voor alles staan. Als numerieke representaties kunnen vectoren voor van alles staan. Wanneer je betekenis aan een vector toekent, dan noem je dat een embedding. Zo kun je een vector maken met betekenis van woorden, afbeeldingen en geluiden. Daarmee kun je als gebruiker zoeken op een specifieke afbeelding en bijvoorbeeld vragen om gerelateerde afbeeldingen. Dit is bijvoorbeeld hoe Google Photos het mogelijk maakt om je geüploade foto’s te doorzoeken op onderwerpen als kat, tuin, glas. Het biedt ook mogelijkheden voor contextuele embeddings en wiskundige bewerkingen van numerieke representaties, zoals de 2e macht van alle klinkers.
Maak vectoren niet te groot. De grootte van de vector is een belangrijke factor. Hoe kleiner de vector, hoe groter de nauwkeurigheid van de output. Maak daarom geen vectoren van hele pagina’s, maar ook niet per woord. Een goede grootte voor standaard tekst is 100 tot 300 woorden. Elke FAQ kun je als een afzonderlijke vector creëren, zodat je slimme stukjes maakt.
Sla ook de URL op. Naast de vector kun je ook informatie opslaan als meta-data, zoals de URL van de pagina waar de tekst vandaan komt. Dit is handig voor het achterhalen van de bron wanneer je bijvoorbeeld negatieve feedback krijgt. Denk bijvoorbeeld aan de voorwaarden van een verzekering: als die zijn geüpdate dan wil je ook de vectoren updaten.
Dimensies kosten geld. Het gebruik van vectordatabases met veel dimensies kan kostbaar zijn. Als organisatie zul je de kosten van meer dimensies moeten afwegen tegen de nauwkeurigheid van de resultaten. Welke vragen wil je kunnen beantwoorden? En welke zijn minder waardevol?

De mens blijft centraal staan

Het AI-tijdperk is aangebroken. Elke dienst en product kan nu worden ondersteund met een gespecialiseerde AI-chatbot die een breed scala aan vragen kan beantwoorden. Door deze vooruitgang worden niet alleen data en kennis toegankelijker, maar verbetert ook de customer experience. De sleutel tot succes zit echter niet in volledige automatisering en overgave aan de technologische mogelijkheden.Menselijke input is essentieel om het volledige potentieel van AI te ontsluiten. De kwaliteit van de data waarmee een LLM-model wordt getraind en een vectordatabase wordt gevuld, vormt hierbij de kern. Gebruik je daarvoor AI-gegenereerde content in plaats van menselijk geschreven content, dan loopt de kwaliteit van de output hard achteruit. Een vectordatabase weet niet intrinsiek dat een pepersteak pittig is maar niet verkruimelt: dat zal een mens moeten duiden. Menselijke input speelt ook een cruciale rol in ethiek binnen het AI-landschap. Ethiek en verantwoordelijkheid zijn onlosmakelijk verbonden met het ontwikkelen en implementeren van AI-technologieën. Het vermogen om betekenis te geven aan specifieke woorden, culturele context te begrijpen en morele overwegingen te maken, is inherent menselijk. De menselijke maat is uiteindelijk wat je AI-model maakt of kraakt: succes wordt gedefinieerd door je gebruikers.

Over de spreker

Raymond Muilwijk

iO Group AI Director

Met een uitgesproken visie op - en ervaring in - strategie, enterprise & solution architecture, product management en software delivery, is Raymond binnen het Center of Excellence de juiste man op de juiste plaats. Verantwoordelijk voor iO's technology visie en als accelerator van kennis en innovatie. Kennis het delen waard, als het kloppend hart van elke organisatie.

Meer weten over Large Language Models?

In deze whitepaper kijken we naar het verleden, heden en de toekomst van AI-taalmodellen. Leer bovendien tips en tricks om zelf met AI aan de slag te gaan.

Download nu