Geautomatiseerd informatie uit social media halen; beweging bij ziekenhuisopname meten

5 december 2019
Geautomatiseerd informatie uit social media halen; beweging bij ziekenhuisopname meten
eHealth

Identificatie van bijwerkingen in data uit social media
Het staat buiten kijf dat gegevens uit social media een toegevoegde waarde hebben in medisch-wetenschappelijk onderzoek. Eén van de grote uitdagingen van deze databron is de ongestructureerde vrije tekst waaruit deze gegevens bestaan. Ook in ons eigen onderzoek naar de perceptie van veiligheid van medicatiegebruik tijdens de zwangerschap (begin augustus gepubliceerd, red.) liepen we hier tegen aan: uiteindelijk hebben we de ruim 9.000 berichten zelf gelezen en handmatig gescoord¹. Het kan kosteneffectief zijn om bij grote aantallen berichten het kaf van het koren te scheiden met natural language processing (NLP) en machine learning. Deze methoden kunnen gecategoriseerd worden in drie groepen, gebaseerd op de verschillende niveaus van complexiteit en precisie: (a) de co-occurrence benadering, (b) de rule-based benadering en (c) de statistical learning methoden. Gavrielov-Yusim en collegae onderzochten deze methoden om bijwerkingen van medicijnen te identificeren op basis van gegevens uit social media².

Bij het maken van een keuze voor een methode voor het selecteren en extraheren van bruikbare data uit berichten op social media spelen afwegingen zoals de ‘ernst’ van onterechte inclusie van niet-relevante berichten (fout-positieven) en het missen van relevante 

berichten (fout-negatieven) een rol. 

In de context van bijwerkingen kunnen fout-positieven leiden tot de noodzaak om geselecteerde berichten handmatig te screenen, terwijl fout-negatieven ervoor kunnen zorgen dat bijwerkingen niet geïdentificeerd worden. In dit onderzoek werden gegevens van meer dan 1.000 Engelstalige patiëntfora, blogs en patiënt-support groepen geëxtraheerd met een open source Apache Nutch library. Social media zoals Facebook en Twitter werden niet meegenomen, omdat deze niet primair gericht zijn op gezondheid. 

De co-occurrence benadering is de eenvoudigste methode van de drie: alle berichten waarin een geneesmiddel en een klinische uitkomst in één zin worden genoemd, worden geselecteerd. Vanwege het grote potentieel voor fout-positieven werd aanvullend NLP ingezet, voordat signaaldetectie-algoritmen daadwerkelijke verbanden tussen medicijngebruik en bijwerkingen gingen bepalen. De mogelijke bijwerkingen die hiermee geïdentificeerd werden in de social media werden vergeleken met VigiBase, een wereldwijde database van 16 miljoen individuele meldingen van bijwerkingen.

Methoden identificeren bijwerkingen

Beide methoden (co-occurrence met of zonder NLP) bleken in staat om bijwerkingen te identificeren, in veel gevallen sneller dan dat via VigiBase kon. Logischerwijs was het aantal geïdentificeerde berichten met bijwerkingen veel hoger in de benadering zonder NLP (N=2500) dan met NLP (N=435). Dat suggereert dat NLP 83 procent van de berichten op basis van inhoud excludeert. Wanneer gegevens uit social media toegevoegd zouden worden aan de huidige strategieën van identificatie van bijwerkingen, zou dit tot gevolg hebben dat beoordelaars veel meer mogelijke bijwerkingen moeten beoordelen, waarvan een substantieel deel uiteindelijk toch niet relevant blijkt te zijn.

Wanneer er gekeken werd naar de aard van de bijwerkingen, bleken er grote verschillen te bestaan tussen de bijwerkingen in VigiBase en de bijwerkingen op genoemd op social media. In de laatste bron viel een groot deel van de bijwerkingen onder de noemer ‘kwaliteit van leven’, terwijl in de officiële registratie voornamelijk klinische, ernstige bijwerkingen vastgelegd waren. 

Dit benadrukt de aanvullende waarde van social media voor medisch-wetenschappelijk onderzoek, waaruit heel sterk naar voren kan komen wat daadwerkelijk voor de patiënt relevant is. Onderzoekers doen er daarom goed aan om deze informatiebron niet uit het oog te verliezen bij het opstellen en beantwoorden van medisch-wetenschappelijke vraagstellingen.

Beweging meten met een slimme pleister

Patiënten bewegen weinig tijdens een ziekenhuisopname: we zijn met zijn allen toch best gericht op het bed. Dit heeft negatieve gevolgen, zoals een snelle afname van spierkracht en langdurig verlies van zelfstandigheid. Voldoende beweging tijdens een ziekenhuisopname draagt juist bij aan een beter uithoudingsvermogen en je vrijer voelen. Het is voor zorgverleners daarom belangrijk om beweging goed te kunnen meten, zodat ze patiënten kunnen helpen voldoende te bewegen tijdens een ziekenhuisopname. Ondanks dat het goed meten van bewegen moeilijk is, blijkt uit een voorgaande studie dat het mogelijk is om de beweging van gezonde proefpersonen continu (24 uur per dag) te meten met een draagbare sensor, de HealthPatch¹. In een recente studie van Koenders en collegae blijkt dat deze sensor ook gebruikt kan worden in wetenschappelijk onderzoek naar de beweging van patiënten tijdens de ziekenhuisopname².

Het doel van dit onderzoek was bepalen of het mogelijk is om de beweging van patiënten tijdens een ziekenhuisopname continu (24 uur per dag) te meten met de HealthPatch. Daarnaast is onderzocht of het bewegingspatroon van de patiënten tijdens de opname samenhing met mogelijke barrières. 

De HealthPatch is een draagbare sensor die behalve beweging ook ademhalingsfrequentie, lichaamstemperatuur en hartslag meet. Deze wordt op de borstkas geplakt en meet beweging met behulp van een versnellingsmeter (accelerometer). De beweegdata, zoals de hoeveelheid liggen, zitten/staan, en lopen, werd gedurende de eerste vier dagen van de ziekenhuisopname verzameld. Vervolgens werd de samenhang onderzocht tussen de beweegdata en bekende belemmeringen voor bewegen, zoals pijnklachten en het gebruik van katheters, drains en zuurstoflijnen.

Door innovation partner