Tools, techniek & integratie

Context engineering voor finance-AI

Waarom de kwaliteit van AI-output op finance-vragen vaker afhangt van context dan van prompt — en hoe je kiest tussen flat context, documenten, RAG en directe boekhouding-koppeling.

6 min
  • context
  • rag
  • privacy
  • finance

Context engineering voor finance-AI is het bewust kiezen welke informatie, in welke vorm, via welk kanaal bij het model terechtkomt — flat context in de prompt, documenten als attachment, RAG via een kennisbank, of directe koppeling met de boekhouding. Voor finance-teams bepaalt deze keuze of het antwoord bruikbaar wordt of generieke finance-praat met hoge hallucinatie-kans.

De kwaliteit van een AI-antwoord op een finance-vraag wordt vaker bepaald door de context dan door de prompt. Een prompt van drie zinnen met het juiste rekeningschema en de juiste KPI-definitie levert bruikbare output; diezelfde prompt zonder context levert generieke finance-praat met een grote kans op hallucinatie. Context engineering is het bewust kiezen welke informatie, in welke vorm, via welk kanaal bij het model terechtkomt.

Waarom het in finance specifiek telt

Modellen zijn getraind op het algemene internet. Ze weten wat een maandafsluiting is, hoe IFRS-toelichtingen lopen, hoe een variance-analyse is opgebouwd. Ze weten niets van jouw rekeningschema, jouw klantenlijst, jouw KPI-definities, jouw close-handboek of jouw cijfers van vorige maand. Elke keer dat je het model iets specifiek finance-gerelateerd wilt laten doen, moet je dat verschil overbruggen.

Voor finance specifiek is dit extra kritisch om twee redenen. Cijfers tolereren geen vaagheid — een "ongeveer juiste" toelichting met de verkeerde grootboekrekening is fout, geen benadering. En de output landt vaak in een formele context (board-pack, jaarrekening, BTW-aangifte) waar audit-bewijs nodig is van waarop de output is gebaseerd.

Vier vormen van context — plus één finance-specifieke

1. Flat context

Tekst direct in de prompt plakken. Een grootboek-extract van 50 regels, drie klantvoorbeelden, een KPI-definitie. Simpelste vorm, werkt voor korte opdrachten. Beperking: handwerk en blijven binnen het context-window. Wel de snelste weg naar een eerste resultaat.

2. Documenten uploaden

Eén of meer PDF's, Word- of Excel-bestanden. Het model leest of scant ze. Onder de motorkap kan dit twee dingen zijn: full context (alles in het context-window geladen) of RAG (in stukken gehakt en doorzocht). Welke van de twee hangt af van documentgrootte en platform — niet altijd transparant.

3. RAG — Retrieval Augmented Generation

Voor grote finance-kennisbanken (een compleet close-handboek, een fiscaal naslagwerk, jaren aan historische rapportages) is full context onmogelijk. RAG splitst alle documenten in stukjes, indexeert ze semantisch, en haalt bij elke vraag de paar meest relevante stukjes op. Schaalbaar naar miljoenen pagina's, betaalbaar, snel.

Nadeel voor finance: RAG mist structuur en overzicht. Een fiscale clausule die alleen begrijpelijk is in combinatie met een definitie drie hoofdstukken eerder, kan verloren gaan. Voor verkennende Q&A: prima. Voor zorgvuldige close-reading van een transfer-pricing-rapport waar elke clausule telt: risicovol.

4. Full context injection

Het hele document gaat in het context-window. Het model leest alles. Beste kwaliteit voor close reading — niets wordt gemist, context blijft intact. Duur en traag bij grote documenten, en begrensd door het context-window van het model.

5. Live boekhouding-koppeling (MCP) — finance-specifiek

Een variant bovenop de eerste vier en voor finance vaak de meest waardevolle: het model haalt direct uit Exact (of een ander boekhoudpakket) op wat nodig is, on-demand. Geen export, geen Excel-tussenstap, geen verouderde knowledge — het is altijd actueel. Voor finance-vragen ("welke openstaande debiteuren zijn ouder dan 60 dagen") is dit de bestaansreden van platforms als Saldus.

Context-limits per model — begin 2026

Voor finance-context: hoeveel finance-data past er in één request?

  • GPT-5 Fast: ~32K tokens, circa 24.000 woorden of 50 pagina's. Geschikt voor een KPI-definitie + één rapportage.
  • GPT-5 Thinking: ~196K tokens, circa 147.000 woorden of 300 pagina's. Genoeg voor een groot rapportage-cluster.
  • Claude Opus 4.5 / Sonnet 4.5: 200K tokens standaard, 1M in enterprise — genoeg voor een hele contractenportefeuille of jaarstukken-pakket.
  • Gemini 3 Pro / Flash: 1M tokens (~750.000 woorden), ruim 1.500 pagina's — grootste window op de markt.
  • Saldus Q&A-agent: koppelt direct via MCP; alleen de relevante data wordt opgevraagd, geen window-grens.

Praktische vuistregel voor finance:

  • Onder 50 pagina's: upload direct, kies een model dat full context kan lezen.
  • 50-500 pagina's: Claude Opus 4.5 of Gemini 3 Pro. Full context blijft mogelijk; output is betrouwbaarder dan RAG voor formeel werk.
  • Boven 500 pagina's: RAG of een hybride aanpak. Geef in de prompt aan welke secties je vermoedt dat relevant zijn.
  • Vragen over actuele data uit de boekhouding: live-koppeling via MCP — niet een wekelijkse export proberen vers te houden.

De trade-off: RAG versus full context — finance-versie

Voor finance:

  • Breedtevraag op een grote bron ("welke jaarrekeningen in ons archief hadden een toelichting over goodwill-bijzondere-waardevermindering?") → RAG.
  • Dieptevraag op een afgebakend document ("wat zijn de aansprakelijkheidsclausules in deze klantcontract van 80 pagina's?") → full context.
  • Vragen op actuele cijfers ("wat is het saldo van rekening 4000 in april") → niet via knowledge-files, maar via live MCP-koppeling met de boekhouding.
  • Mengvorm — een grote bron waar je structurele samenhang wilt bewaken → full context op een gefilterde subset, eventueel na een eerste RAG-filter.

Concreet voorbeeld: de 144 pagina's van de EU AI Act in ChatGPT laden om te vragen of een specifieke finance-use-case onder high-risk valt. ChatGPT chunkt en retrievet — snel, maar kan clausules missen die in combinatie gelezen moeten worden. Datzelfde document in Gemini 3 of Claude Opus 4.5 met full context: volledig ingelezen, precieze artikel-en-lid-citaten.

Drie vragen voor elke finance-vraag aan AI

  1. Welke context heeft het model nodig om deze vraag correct te beantwoorden? Rekeningschema? KPI-definitie? Actuele saldi? Eerdere toelichtingen?
  2. Zit die context al in het model (algemene knowledge) of moet ik hem toevoegen?
  3. Als ik hem toevoeg, kies ik flat context (plakken), documenten (uploaden), RAG (grote bron doorzoeken), of een live boekhouding-koppeling?

Wie deze vragen expliciet stelt vóór de prompt, sluit 80% van de hallucinatie-risico's uit. De resterende 20% is een kwestie van goed lezen van de output en numerieke verificatie.

Privacy en GDPR bij context-injection in finance

Zodra je context toevoegt, stuur je finance-data naar het model. Wie die data ontvangt en wat ermee gebeurt hangt af van het platform en de tier.

  • Consumer-ChatGPT en Claude.ai: gesprekken worden standaard bewaard, eventueel voor productverbetering gebruikt. Voor finance-data met klantnamen of cijfers vrijwel altijd geen acceptabele route.
  • OpenAI API en Anthropic API: zero data retention voor zakelijke klanten. Geschikt voor eigen toepassingen.
  • Claude Enterprise, ChatGPT Enterprise/Team, Microsoft Copilot for Business: contractuele garanties, data-residentie, audit-logs. Geschikt voor de meeste finance-context — mits DPA en met aandacht voor settings als Flex Routing in Copilot.
  • Saldus embedded: alles op klant-eigen infrastructuur. Geen data verlaat de tenant. Voor de gevoeligste finance-context (M&A, salaris-niveau, zorg-klanten).

Concreet: een grootboek van een klant uploaden in een consumer-ChatGPT-account is een datalek onder de meeste klantcontracten. Hetzelfde bestand in een Claude Enterprise-omgeving is gewoon werk. De regel is niet "geen AI met klantcijfers", maar "AI met klantcijfers alleen in de juiste tier".

Audit-grade-perspectief

Context-keuzes horen in audit-bewijs: per AI-antwoord moet reconstrueerbaar zijn welke context is meegegeven (welke versie van het rekeningschema, welke KPI-definitie, welk saldo uit welke periode). Bouw dit in als logging-vereiste, niet als optie. Een AI-antwoord zonder context-trace is voor finance-werk waar het ertoe doet hetzelfde als een Excel-formule zonder bron-verwijzingen — technisch correct maar audit-onbruikbaar.

Saldus in de praktijk

Saldus is opgebouwd rond context engineering specifiek voor finance: de Tenant Context Pack levert per tenant rekeningschema, KPI-definities, periode-policy en boekhoud-semantiek aan elke agent; de MCP-laag haalt actuele cijfers live op uit Exact; en per antwoord wordt gelogd welke context-bron is gebruikt en welke versie. Dat ontslaat het team niet van het bouwen van de context (rekeningschema moet schoon zijn, KPI-definities moeten kloppen) — het zorgt dat de context-discipline gestructureerd in plaats van ad-hoc gebeurt.

Verder lezen

AVG-compliant verwerker
Audit-grade logging
Pen-tested platform