Ontdekken virussen door cloud goed voor pandemiepreventie

Technologie heeft het voortouw genomen bij de behandeling van de pandemie, maar is er niet in geslaagd deze te voorkomen. Toen het COVID-virus eenmaal was geïdentificeerd, kwam alles in een stroomversnelling. De onbekende ziekteverwekker werd binnen enkele weken gereconstrueerd met behulp van ‘high-throughput sequencing’ en er werden screeningtests ontwikkeld. Vaccins werden in recordtijd gemaakt met behulp van boodschapper-RNA-technieken. Maar we misten het werkelijke doel: een pandemie voorkomen door de besmettelijke ziekteverwekker zo vroeg mogelijk op te sporen en te identificeren.

We weten dat de meeste nieuwe besmettelijke ziekten worden veroorzaakt door RNA-virussen die van dieren op mensen worden overgedragen. Ebola, MERS, SARS, Zika, influenzavirussen en SARS-CoV-2 zijn het resultaat van deze overdracht tussen soorten. Om bekende en onbekende virussen te identificeren, hebben onderzoekers toegang tot gigantische databanken die voortdurend in omvang toenemen.

Alleen al het Sequence Read Archive (SRA) bevat miljoenen gigabytes aan genetische sequensen waarmee mogelijk honderdduizenden nieuwe virussen kunnen worden geïdentificeerd. Ondanks al deze kennis hebben we het COVID-virus te laat ontdekt, omdat we de enorme set aan data niet snel genoeg konden benutten.

Cloud geeft nieuwe impuls

Met de exponentiële groei van genomische data liepen traditionele krachtige computers tegen hun grenzen aan. Het zou meer dan een jaar duren om de SRA-databank te analyseren, tegen te hoge kosten. Dus kwam een internationaal team van onderzoekers op het idee om met de kracht van de AWS Cloud het ‘Serratus Platform’ te creëren door samen te werken met het Cloud Innovation Centre (CIC) aan de University of British Columbia in Canada.

Dit open-source wetenschappelijk project heeft als doel alle bekende en onbekende coronavirussen ultrasnel te identificeren en te catalogiseren als reactie op de COVID-19 pandemie. Verwacht wordt dat dit ‘high-throughput sequencing alignment’-platform de bio-computing de komende jaren ingrijpend zal veranderen, te beginnen met de virologie.

Serratus voldoet aan alle eisen voor efficiëntie. Het hele project kostte 20.000 euro, en het duurde slechts acht weken om een cluster van 22.500 computers in een sterk gecontroleerde architectuur op te zetten. De resultaten zijn overtuigend. Serratus doorzocht 5,7 miljoen biologische monsters wereldwijd verzameld, oftewel 20 miljoen gigabyte aan gegevens, en produceerde resultaten in slechts 11 dagen, terwijl dit met een enkele computer meer dan 2000 jaar zou hebben geduurd.

Wereldwijd bewakingssysteem

Het Serratus-platform heeft al geleid tot de ontdekking van 132 000 nieuwe RNA-virussen en negen nieuwe coronavirussoorten. Vóór Serratus waren slechts 15 000 RNA-virussen bekend in openbare databanken. Deze vorderingen zullen bijdragen tot de totstandkoming van een wereldwijd bewakingssysteem, aangezien de database en de sequenties, gegroepeerd onder de naam ‘Open Virome’, kunnen worden geïntegreerd in diagnose- en onderzoeksinstrumenten.

Serratus kan ook een rol spelen bij de ontwikkeling van vaccins doordat het evolutionaire data oplevert om te begrijpen hoe virale oppervlakte-eiwitten in de loop van de tijd veranderen. Deze grondige kennis die het project oplevert, helpt de oorsprong van de pandemie te bepalen, maar nog belangrijker: een volgende pandemie te voorkomen. Om dit te bereiken is het van cruciaal belang de verspreiding van een virus zo vroeg mogelijk te stoppen

Naar real-time preventie volgende pandemie

Nu alle instrumenten voor de verwerking en analyse van de sequencing data beschikbaar zijn, zullen de onderzoekers hun inspanningen richten op het in real time voorkomen van een pandemie. Dit gebeurt door het automatiseren van de gegevensannotaties die nodig zijn om onbekende virussen te identificeren.

De pandemie heeft de essentiële rol van data in de moderne wereld onder de aandacht gebracht. De verzameling en analyse van data op alle gebieden geneeskunde betekent een revolutie in het onderzoek en de gezondheidszorg. Ook kunstmatige intelligentie wordt steeds meer gebruikt om nauwkeurige analyses en diagnoses te stellen. Dit vereist aanzienlijke rekenkracht, die alleen de cloud tegen redelijke kosten kan leveren.