De Britse National Health Service (NHS) heeft in het Foresight-project de gegevens van zo’n 57 miljoen inwoners van Engeland gebruikt om een gelijknamig AI-model te trainen. Het doel is om een innovatief, AI-gedreven systeem te ontwikkelen waarmee artsen, zorgplanners en beleidsmakers de gezondheidsuitkomsten van inwoners van het Verenigd Koninkrijk beter kunnen voorspellen en zo preventieve gezondheidszorg in het VK moeten gaan transformeren. Toch zijn er ook zorgen over de ontwikkeling van Foresight, juist vanwege de omvang van de gebruikte dataset.
De intentie van de NHS is om met hun AI-model onder andere beter te voorspellen wanneer mensen ziek worden en in het ziekenhuis opgenomen moeten worden: een doel met de COVID-19-pandemie en daaraan gerelateerde overbelasting van de ziekenhuiscapaciteit in het achterhoofd. Om zo nauwkeurig mogelijke voorspellingen te kunnen doen, is de AI getraind op een enorme hoeveelheid gezondheidsgegevens. Idealiter weet de NHS straks gezondheidscomplicaties te voorspellen voordat ze plaatsvinden, waardoor zo vroeg mogelijk ingegrepen kan worden en op grote schaal preventieve zorg kan worden geleverd.
Zorgen over dataprivacy
De potentiële voordelen van Foresight zijn groot, maar er zijn ook zorgen. Vooral de privacy van de personen wiens gegevens gebruikt worden om het AI-model mee te trainen, wordt in twijfel getrokken. Daar lijkt een van de positieve aspecten van Foresight, de enorme hoeveelheid data waar het model op is getraind, gelijktijdig een nadeel te vormen. De gegevens zijn zodanig rijk aan informatie, dat enkel het weghalen van basisgegevens – zoals een naam en geboortedatum – geen garantie biedt dat de data niet verbonden kunnen worden aan de identiteit van een persoon.
Om het risico op identificatie te beperken, wordt op dit moment gewerkt binnen een beveiligde dataomgeving van de NHS. Als het goed is, zou dit moeten voorkomen dat gegevens kunnen worden gelekt. Het model en de data zijn momenteel dan ook alleen beschikbaar voor onderzoekers die daartoe goedkeuring hebben. Digitale infrastructuur wordt geleverd door Amazon Web Services en het bedrijf Databricks, maar deze partijen hebben in principe geen toegang tot de data.
Reactie publiek
Een andere zorg over Foresight is de reactie van het publiek. De gezondheidsgegevens van de NHS zijn gebruikt om het model te trainen, zonder dat de personen wiens data dit betreft daar toestemming voor hebben gegeven. Ook als gegevens geanonimiseerd worden, hebben sommige mensen ethische bezwaren tegen het gebruik ervan voor AI-toepassingen. Veel mensen willen de controle houden over hun eigen gegevens, zeker als het om gezondheidsdata gaat. En dat kan het publieke vertrouwen in AI, de gezondheidszorg en overheden verder schaden.
De zorgen en ophef die zijn ontstaan over het grootschalige gebruik van gezondheidsdata bij het trainen van Foresight, hebben ertoe geleid dat het project begin juni is gepauzeerd. Het gezamenlijke IT-comité van de British Medical Association (BMA) en de Royal College of General Practicioners (RCGP) gaf aan dat ze niet op de hoogte waren gebracht van het feit dat de data die oorspronkelijk werden verzameld voor onderzoek naar COVID-19 ook ingezet werden om een AI-model te trainen. Daarnaast nemen ze het consortium dat aan Foresight werkt kwalijk dat het project niet aan een adviesraad van artsen is voorgelegd voordat de data aan het AI-model werden gevoerd.
Lees het hele artikel in de onlangs verschenen vierde editie van ICT&health. Of lees het in ons online magazine.