Embeddings voor slimme zoekopdrachten:
hoe het werkt en wanneer.
Embeddings zijn numerieke vectoren die de betekenis van een tekst vastleggen. Ze maken zoeken op betekenis mogelijk — een vraag over "geld terug" vindt documenten over "retourbeleid" zonder dat de exacte woorden matchen. Voor 70% van de search-use-cases verslaat dit klassieke keyword-search.
Wanneer wel, wanneer geen embeddings?
Wel: zoeken op betekenis (FAQ, support-archief, productcatalogus). Niet: exacte ID/SKU-zoek, structured filtering, datum-ranges. Vaak combineer je beide — hybrid search met BM25 + embedding rerank.
Q1Welke embedding-model?+
Q2Kosten?+
Verdieping: waarom AI in NL-mkb anders speelt
Voor Nederlandse mkb-bedrijven is de keuze om AI in productie te zetten sinds 2024 fundamenteel veranderd. Drie ontwikkelingen liggen daaraan ten grondslag: EU-data-residency wordt door alle grote LLM-providers nu aangeboden (Anthropic op AWS Frankfurt en GCP EU, OpenAI op Azure EU), zero-retention API-plannen zijn standaard geworden voor enterprise-tier, en de kosten per query zijn met 5–10x gedaald sinds 2023. Wat twee jaar geleden alleen voor scale-ups haalbaar was, draait nu binnen het mkb-budget.
De grootste praktijk-misvatting in deze ronde van AI-adoptie: founders denken dat ze "een model moeten trainen". In 99% van de mkb-toepassingen klopt dat niet — wat je doet is retrieval-augmented generation bovenop een bestaand model. Geen training, geen ML-expertise, geen GPU-cluster. Wel: heldere bronnen, een Postgres-database met pgvector, en discipline in prompts.
Stappenplan: van idee tot productie-AI
1Spike-week (1 week)+
2Bronnen voorbereiden+
3Indexeren met pgvector+
4Productie-pipeline+
5Monitoring & tweaken+
Welk model wanneer — een eerlijke keuzehulp
Veelgestelde vragen
Q1Wat als de chatbot iets fout zegt?+
Q2Hoeveel kost een typische maand in productie?+
Q3Kan dit voor advocatenkantoor of zorgpraktijk?+
Q4Hoe vaak moet ik bronnen updaten?+
Q5Wat als Anthropic of OpenAI offline gaat?+
Lange-termijn perspectief: AI in productie hoort bij je stack
De keuze om AI in productie te zetten is in 2026 vergelijkbaar met de keuze om in 2014 een API-laag op je product te zetten: het voelt nog optioneel, maar wordt binnen 18 maanden de norm. Bedrijven die nu een werkende RAG-laag hebben — gevoed met eigen documentatie, draaiend op zero-retention plannen, met audit-logs per query — bouwen een asset die door elke volgende productontwikkeling heen meegroeit.
De fout die je nu nog kunt maken is te groots beginnen. Niet "we bouwen een AI-strategie", wel "we lossen één concreet probleem op met AI". Een chatbot die 60% van eerste-lijn klantvragen afhandelt is meer waard dan een grandioos plan voor een “AI-platform” dat over 18 maanden nog niet live is. Klein beginnen, meten, uitbreiden — die volgorde is in deze fase nog steeds doorslaggevend.
Drie ontwikkelingen die de komende 12 maanden het speelveld verschuiven: (a) kosten van inference dalen met nog eens 5–10× door competitie tussen Anthropic, OpenAI, Google en open-source modellen; (b) tool-use en function calling worden volwassen genoeg om echte AI-agents te bouwen voor specifieke workflows; (c) EU-data residency wordt verplicht voor steeds meer sectoren (zorg, juridiek, finance) — wie nu al EU-conform bouwt heeft geen migratie-pijn straks.
Concreet voorbeeld uit een lopend project
Een Rotterdams advocatenkantoor (8 advocaten) implementeerde eind 2025 een eerste-lijns AI-screening op basis van Claude + RAG over hun openbare publicaties en standaard-voorlichting. Resultaat na 90 dagen: 62% van inkomende leadgesprekken doorlopen door de chatbot zonder eerstelijns-jurist, 28% kwamen al voorgesorteerd bij de juiste advocaat met een gestructureerd intake-document. Bouwbudget: €11k.
Wat het project liet werken: bronnen waren strikt beperkt tot publiek beschikbare informatie (geen NDA-stof in retrieval), de chatbot weigerde expliciet juridisch advies te geven en escaleerde altijd naar kantoor, en bij elk antwoord stond een bronvermelding klikbaar. Geen hallucinaties in 90 dagen productie, want het model kreeg expliciet instructie om alleen te antwoorden vanuit de retrieved fragments.
Het mooie is dat de eerste lead die de bot kwalificeerde een dossier opleverde van €18k. Bouwkosten waren in week 4 al terugverdiend. — managing partner, lopend project Rotterdam