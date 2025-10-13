Onderzoekers van ETH Zürich hebben een revolutionaire digitale tool ontwikkeld waarmee wetenschappers net zo gemakkelijk door de genetische gegevensarchieven van de wereld kunnen zoeken, vergelijkbaar met zoekopdrachten in Google. Het systeem, MetaGraph genaamd, maakt snelle full-text zoekopdrachten in wereldwijde DNA- en RNA-databases mogelijk. Een innovatie die biomedisch onderzoek en de ontwikkeling van nieuwe behandelingen zou kunnen versnellen.

Al decennialang heeft DNA-sequencing gezorgd voor grote vooruitgang in de geneeskunde, van het identificeren van zeldzame erfelijke ziekten tot het ontcijferen van het SARS-CoV-2-genoom. Maar door de enorme hoeveelheid genomische gegevens, meer dan 100 petabytes opgeslagen in internationale archieven zoals het Sequence Read Archive (SRA) en het European Nucleotide Archive (ENA), was efficiënt zoeken vrijwel onmogelijk. Tot nu toe hadden onderzoekers enorme rekenkracht en tijdrovende downloads nodig om gegevens te analyseren.

Zoeken naar DNA- of RNA-sequenties

MetaGraph brengt hier verandering in. Deze tool, gepubliceerd in Nature, stelt gebruikers in staat om een DNA- of RNA-sequentie in een zoekveld in te voeren en direct te ontdekken waar die sequentie in openbare datasets voorkomt. “Het is een soort Google voor DNA”, zegt prof. Gunnar Rätsch, datawetenschapper aan de ETH Zürich.

Door genomische informatie met een factor 300 te comprimeren, maakt MetaGraph het mogelijk om biologische sequenties van mensen, dieren, planten, virussen en bacteriën met opmerkelijke snelheid en efficiëntie te indexeren en te doorzoeken. De tool verlaagt niet alleen de computerkosten – geschat op minder dan 1 dollar per megabase – maar integreert ook ruwe sequentiegegevens met beschrijvende metadata, wat zorgt voor nauwkeurige en uitgebreide resultaten.

Volgens dr. André Kahles van de Biomedical Informatics Group van ETH is de schaalbaarheid van het systeem het belangrijkste voordeel: “Hoe meer gegevens we opvragen, hoe minder extra rekenkracht er nodig is.” Momenteel bestrijkt MetaGraph bijna de helft van alle wereldwijde sequentiedatasets, en tegen het einde van het jaar wordt volledige dekking verwacht.

Belangrijke implicaties voor de gezondheidszorg

De implicaties voor de gezondheidszorg en de levenswetenschappen zijn aanzienlijk. Onderzoekers kunnen nu binnen enkele seconden antibiotica-resistente genen identificeren, mutaties van ziekteverwekkers volgen of zoeken naar therapeutische virussen (bacteriofagen), waardoor de ontdekking van nieuwe geneesmiddelen en diagnostische hulpmiddelen wordt versneld.

Naarmate genoomsequencing steeds sneller en betaalbaarder wordt, zouden tools zoals MetaGraph binnenkort ook buiten het laboratorium kunnen worden gebruikt. “In het begin wist zelfs Google niet wat een zoekmachine zou worden”, merkt Kahles op. “Op een dag kunnen tools zoals deze iedereen helpen om genetische eigenschappen te identificeren, of zelfs hun eigen kamerplanten, met behulp van DNA.”