Ethiek in het onderzoek van de toekomst
Om onderstaande en alle andere premium artikelen te lezen, moet u inloggen of een account aanmaken.
U kunt nog {free_articles_left} premium artikel gratis lezen. Om meer premium artikelen te lezen, moet u inloggen of een account aanmaken.
Door Sila Aartsen en Eveline Wouters. Tekst gebaseerd op: ‘Ethiek van praktijkgericht onderzoek; zonder ethiek is het al moeilijk genoeg’.
Hoe betrouwbaar is een studie die gebruik maakt van data verkregen via social media? Is ‘anoniem’ wel echt anoniem als het Big Data betreft? Ontwikkelingen op het gebied van data en technologie werpen nieuwe ethische consequenties op in de onderzoekswereld.
Bedrijven, overheden en onderwijsinstellingen zijn steeds meer in staat grote hoeveelheden data te analyseren om inzicht te krijgen in het gedrag van consumenten, burgers en studenten. We spreken dan over ‘Big Data’. Maar wat zijn big data eigenlijk?
Een min of meer geaccepteerde zienswijze is dat big data bestaat uit drie componenten: • Een enorme omvang aan digitale data (volume) • Data zijn divers en vaak ongestructureerd (variety) • Deze data worden in een hoog tempo geproduceerd en verwerkt (velocity) [1]
Het gaat dus niet alleen om de hoeveelheid data, het gaat ook om diversiteit en snelle beschikbaarheid van data. De onderzoeksvragen die onderzoekers met Big Data beantwoord willen zien, is bij aanvang van de onderzoeken nog niet scherp omlijnd: de onderzoeken worden vaak iteratief bijgesteld aan de beschikbare data. Met behulp van Big Data kan er namelijk ‘onbekende en verborgen informatie’ worden gevonden; informatie die nuttig kan zijn voor de maatschappij, de praktijk of de gezondheidszorg, maar waar voorheen nog niet aan werd gedacht.
Op de Universiteit van Ontario (Institute of Technology), Canada, worden pasgeboren baby’s continu gemonitord op de intensive care. Door het continu in kaart brengen van diverse factoren zoals temperatuur, hartslag en bloeddruk, kan 24 uur voordat een complicatie plaatsvindt deze voorspeld worden. Hierdoor kan de arts vroegtijdig een behandeling starten.
Big data staat haaks op het huidige wetenschappelijk denken, waarin een hypothese geformuleerd wordt. Zo worden subsidies voor wetenschappelijk onderzoek in de gezondheidszorg vaak alleen toegekend aan projecten waarin eenduidige hypotheses worden geformuleerd. Dit betekent dat het huidige klimaat binnen ‘onderzoeksland’ (inclusief de subsidieverstrekkers) dikwijls geen gelijke tred houdt met de ontwikkelingen binnen de technologie.
Bij het ‘exploratieve karakter’ van big data kunnen ook kanttekeningen geplaatst worden. Deze zijn veelal gerelateerd aan privacy: ‘Wat wordt er eigenlijk allemaal verzameld en geanalyseerd?’ en ‘Wie heeft allemaal toegang tot deze data?’
Met name bij data die vertrouwelijke informatie bevatten, zoals medische informatie, worden deze vragen geopperd. Er zijn veel nationale en Europese wetten die verband houden met privacy van gegevens (www.ccmo.nl), maar die lopen niet altijd synchroon met de voortdurende ontwikkelingen.
Deze wetgeving zorgt ervoor dat individuele datasets zelden gevoelige informatie bevatten; door het verwijderen van identificerende gegevens worden deze gegevens geanonimiseerd. Echter, door het combineren van dergelijke datasets, veelal afkomstig van verschillende bronnen (bijvoorbeeld in het zorgdomein), bestaat de mogelijkheid dat de gegevens ‘gedeanonimiseerd’ worden: combinaties van datasets maken de data weer herleidbaar naar specifieke personen. Uit onderzoek bleek dat maar liefst 40 procent van de deelnemers aan een anoniem DNA-onderzoek uiteindelijk toch geïdentificeerd konden worden [2].
In het huidige zorglandschap wordt er steeds meer gebruik gemaakt van zogenoemde ‘lifestyle gadgets’. Tijdens het dragen worden data verzameld over bijvoorbeeld het aantal genomen stappen, het calorieverbruik en, als het ’s nachts wordt gedragen, de slaapkwaliteit.
Mogen dergelijke wearables worden gebruikt om een onderzoek te starten naar de gezondheid van werknemers? Mogen medewerkers gevraagd worden de data die verkregen worden te delen? De Autoriteit Persoonsgegevens gaf in 2016 een volmondig ‘nee’ als antwoord toen twee bedrijven wearables gebruikten om inzicht te krijgen in de hoeveelheid lichaamsbeweging en slaap van hun medewerkers. Zelfs als medewerkers toestemming geven, blijkt dit in strijd met de Wet bescherming persoonsgegevens.
Een tweede issue dat kan ontstaan betreft de representativiteit van nieuwe vormen van dataverzameling. Overheden, instituten en bedrijven maken bijvoorbeeld steeds meer gebruik van sociale media om inzicht te krijgen in de gedragingen en voorkeuren van groepen. Onderzoek dat gebruik maakt van sociale media is ‘hot’.
Juist omdat dergelijk onderzoek relatief gemakkelijk en snel uitvoerbaar is, is deze vorm van internetonderzoek in trek. De vraag rijst hoe representatief data verkregen via internet eigenlijk zijn: ‘Voor welke groep(en) is deze data representatief?’ en ‘Kan deze data gegeneraliseerd worden naar andere groepen?’ zijn vragen die onderzoekers zichzelf zouden moeten stellen [3].
Bij elke vorm van onderzoek, dus ook bij onderzoek dat zich baseert op data verkregen via social media, is het van belang om onderscheid te maken tussen verschillende populaties of groepen die gebruik maken van social media [4].
Zo zijn de gebruikers van bijvoorbeeld LinkedIn anders dan die van Instagram en verschillen de gebruikers van Instagram op hun beurt weer van de gebruikers van Pinterest.
Als met dergelijke verschillen geen rekening wordt gehouden, kunnen verkeerde conclusies getrokken worden. Stel: onderzoekers zijn geïnteresseerd in het inkomen van werkende mannen en vrouwen en willen LinkedIn-data gebruiken om dit in kaart te brengen. Als deze onderzoekers geen rekening houden met de man-vrouwverhouding op LinkedIn én met het feit dat de meeste LinkedIn-gebruikers veel meer verdienen dan modaal, zouden verkeerde conclusies getrokken worden.
Dit houdt wél in dat dergelijke websites de kennis over hun gebruikers moeten delen met de wereld, zodat onderzoekers er rekening mee kunnen houden in hun analyses. Op deze manier kan het trekken van verkeerde conclusies zoveel mogelijk worden tegengegaan.
Het principe van wetenschappelijk onderzoek is dat (potentiële) deelnemers worden geïnformeerd over het uit te voeren onderzoek en hiervoor schriftelijke toestemming geven.
“Mensen die deelnemen aan medisch-wetenschappelijk onderzoek, moeten daar vooraf schriftelijk in hebben toegestemd. Tussen het informeren en het vragen van toestemming moet voldoende bedenktijd zijn gegeven om tot een afgewogen beslissing te hebben kunnen komen.” (Centrale Commissie Mensgebonden Onderzoek)
Ook voor onderzoek dat niet onder de noemer ‘medisch-wetenschappelijk’ valt, is het gebruikelijk om toestemming te vragen aan deelnemers. Echter, voor onderzoek dat gebruik maakt van honderden of zelfs duizenden (of miljoenen?) deelnemers, bijvoorbeeld bij een onderzoek dat gebruik maakt van Twitter-accounts, is dit onmogelijk.
En stel dat het wel mogelijk was, wie zou het waarderen om dagelijks een uitnodiging te ontvangen om zijn of haar internetdata te mogen gebruiken?
Door de snelle ontwikkelingen op het gebied van technologie en dataverzameling ontstaan nieuwe mogelijkheden. Doordat deze ontwikkelingen steeds een aantal stappen vooruitlopen op de wetgeving, roepen deze ontwikkelingen ook vaak nieuwe ethische vraagstukken op.
Juist door deze ‘achterstand’ is het van belang om als onderzoeker uw ‘ethische antennes’ aan te zetten.
Het is daarom aan te raden om uzelf een aantal vragen te stellen: “Wat zou gebeuren als mijn onderzoek in de krant komt?”, “Zou ik mijn moeder/vader/partner laten meedoen aan een dergelijk onderzoek?”, en “Wat zou ik, als deelnemer aan het onderzoek, verwachten en willen?”
Vooral deze laatste vraag laat onderzoekers denken vanuit een andere invalshoek dan die zij kennen: die van de deelnemer.