Generatieve AI in de geneeskunde. Wat werkt, wat niet

ma 27 oktober 2025 - 15:50
AI
Nieuws

Een nieuw onderzoek in Nature Medicine concludeert dat generatieve kunstmatige intelligentie de manier waarop geneeskunde wordt beoefend begint te veranderen, voornamelijk als assistent. De auteurs melden dat AI-systemen nu helpen bij het schrijven van aantekeningen, het analyseren van gegevens en het ondersteunen van onderwijs, maar nog steeds te maken hebben met beperkingen op het gebied van nauwkeurigheid, vooringenomenheid en toezicht. Ze waarschuwen ook voor “prestatieverschuiving”.

De medische copiloot

Generatieve AI (GenAI) is veel verder gegaan dan de chatbots uit de vroege dagen van de pandemie. De studie Generative artificial intelligence in medicine, gepubliceerd in oktober 2025, merkt op dat op transformatoren gebaseerde modellen zoals GPT-5, Gemini 2.5 Pro en DeepSeek-R1 nu complexe klinische problemen kunnen beredeneren, richtlijnen kunnen opzoeken en zelfs code kunnen schrijven om hun eigen hypothesen te testen.

Deze modellen kunnen worden getraind op kleinere, gespecialiseerde datasets in plaats van op de miljarden algemene webpagina's die in eerdere AI-systemen werden gebruikt. Die verschuiving, schrijven de auteurs, stelt ziekenhuizen en onderzoekscentra in staat om modellen te bouwen die hun unieke patiëntenpopulaties begrijpen zonder enorme computerkosten.

Het meest opvallende potentieel van GenAI ligt in zijn collaboratieve kracht. In plaats van artsen te vervangen, voorzien de onderzoekers een “driehoeksverhouding tussen arts, patiënt en AI”, waarin AI evidence-based inzichten verschaft terwijl de clinicus zijn oordeel en empathie behoudt. Vroege proeven hebben aangetoond dat teams van mensen en AI beter presteren dan elk afzonderlijk bij taken zoals triage en screening op diabetische retinopathie.

Van synthetische gegevens naar slimmere modellen

Een grote uitdaging in het onderzoek naar gezondheidszorg is het gebrek aan schone, deelbare gegevens. Het onderzoek benadrukt hoe GenAI synthetische datasets, realistische patiëntendossiers, scans of laboratoriumresultaten kan genereren die geen identificeerbare informatie bevatten. Dit opent de deur voor modeltraining en medisch onderwijs zonder de privacyregels te overtreden.

De studie beschrijft drie belangrijke architecturen die deze vooruitgang mogelijk maken: variational autoencoders, generative adversarial networks (GAN's) en nieuwere diffusiemodellen die levensechte MRI- of CT-beelden kunnen creëren. Als deze modellen goed zijn getraind, kunnen ze radiologische scans voor zeldzame ziekten simuleren of nieuwe diagnostische algoritmen testen.

Toch waarschuwen de auteurs dat synthetische gegevens risico's met zich meebrengen. Overmatige aanpassing aan kunstmatige patronen kan de prestaties in de praktijk verslechteren en er bestaat een gevaar dat identificeerbare patiëntkenmerken onbedoeld worden gereproduceerd. De oplossing ligt volgens hen in strenge validatieprotocollen en het koppelen van synthetische en echte gegevens om privacy en nauwkeurigheid met elkaar in evenwicht te brengen.

Waar AI al helpt

Hoewel volledige autonomie nog ver weg is, verlicht GenAI nu al enkele van de zwaarste lasten in de gezondheidszorg. De studie belicht drie gebieden met onmiddellijke, praktische impact.

Klinische ondersteuning. Uit eerder onderzoek is gebleken dat grote taalmodellen medische examens kunnen afleggen en vragen van patiënten met verrassende empathie kunnen beantwoorden. Tot nu toe kunnen ze echter het best worden ingezet als assistent in plaats van als adviseur, door diagnoses voor te stellen, klinische aantekeningen te maken of grafieken samen te vatten terwijl een arts de resultaten bekijkt. Hybride teams presteren consequent het beste.

Administratieve ontlasting. Documentatie en facturering nemen tot de helft van de werkdag van een arts in beslag. GenAI-‘scribes’ die consulten transcriberen en samenvatten, hebben in pilotstudies de tijd die nodig is voor het maken van aantekeningen met meer dan 70 procent verminderd. Onderzoekers waarschuwen echter voor overmatig vertrouwen: verzonnen details of verkeerd geclassificeerde facturatiecodes kunnen leiden tot juridische en financiële risico's.

Medisch onderwijs. GenAI-docenten kunnen zich aanpassen aan het leerniveau van een student en realistische gesprekken met patiënten simuleren. Na slechts een paar sessies presteerden studenten die AI-feedback kregen beter dan hun medestudenten die dat niet kregen. Toch benadrukt het onderzoek dat AI een aanvulling moet zijn op de echte patiëntervaring en deze niet mag vervangen, als bescherming tegen overmoed en verkeerde informatie.

Voorzichtigheid, validatie en wat nu?

Ondanks het potentieel benadrukt het onderzoek dat GenAI in de geneeskunde aan dezelfde normen moet voldoen als elke andere klinische interventie. De meeste huidige studies zijn kleinschalig, retrospectief en maken gebruik van niet-klinische eindpunten. De auteurs pleiten voor gerandomiseerde klinische studies met transparante rapportage en voortdurende monitoring om “prestatieverschuiving” te voorkomen.

Er ontstaan evaluatiekaders. Metrics zoals nauwkeurigheid en gevoeligheid worden aangevuld met “extrinsieke” maatregelen, zoals verklaarbaarheid en empathie. Sommige teams testen zelfs het concept van “LLM als rechter”, waarbij AI-systemen elkaars redeneringen en vooroordelen op grote schaal evalueren.

De auteurs schetsen een pragmatische weg voorwaarts: begin met beperkte, duidelijk omschreven taken; behoud menselijk toezicht; en gebruik open benchmarkingdatasets om eerlijkheid tussen populaties te waarborgen. Ze benadrukken ook dat clinici moeten worden getraind om AI effectief te ‘prompten’ en de grenzen ervan te begrijpen.

Uiteindelijk is de visie van de studie voorzichtig maar optimistisch. Als generatieve AI op de juiste manier wordt gevalideerd, kan dit artsen papierwerk besparen, biomedische ontdekkingen versnellen en de toegang tot expertise wereldwijd vergroten. Maar de transformatie zal afhangen van hoe verstandig mensen ervoor kiezen om ze in te zetten, concluderen de onderzoekers, en niet van betere modellen.