Onderzoekers van de Faculteit Ingenieurswetenschappen van The University of Hong Kong hebben twee nieuwe deep-learningalgoritmen ontwikkeld die genetische analyse aanzienlijk verfijnen: ClairS-TO en Clair3-RNA. De algoritmen vergroten de nauwkeurigheid van mutatiedetectie bij kankerdiagnostiek en RNA-gebaseerd genomisch onderzoek en openen daarmee nieuwe perspectieven voor precisiegeneeskunde. De resultaten zijn gepubliceerd in Nature Communications.
Het onderzoeksteam staat onder leiding van Ruibang Luo, verbonden aan de School of Computing and Data Science. De nieuwe algoritmen bouwen voort op long-read sequencingtechnologie, waarbij lange, aaneengesloten DNA- en RNA-fragmenten worden gelezen. Deze technologie levert rijkere genetische informatie op dan traditionele sequencing, maar stelt ook hogere eisen aan data-analyse. Juist bij complexe monsters, zoals tumormateriaal of RNA-data met veel biologische variatie, was betrouwbare interpretatie tot nu toe een uitdaging.
Tumoranalyse zonder referentieweefsel
ClairS-TO richt zich op een hardnekkig probleem in de oncologische diagnostiek: het analyseren van tumormutaties zonder een bijbehorend gezond referentiemonster. In de klinische praktijk zijn zulke ‘matched normal samples’ niet altijd beschikbaar, terwijl ze bij conventionele methoden noodzakelijk zijn om echte mutaties van meetfouten te onderscheiden.
Met een geavanceerde dubbele neurale netwerkarchitectuur pakt ClairS-TO dit anders aan. Eén netwerk bevestigt echte mutaties, terwijl een tweede netwerk sequencingfouten en artefacten filtert. Daardoor kan tumordNA betrouwbaar worden geanalyseerd zonder vergelijkingsmateriaal. Dit verlaagt de kosten, verkort doorlooptijden en maakt nauwkeurige kankerdiagnostiek toegankelijker, ook wanneer het beschikbare monster beperkt is.
Doorbraak in RNA-sequencing
Clair3-RNA betekent een primeur: het is volgens de onderzoekers het eerste deep-learningmodel dat specifiek is ontwikkeld voor het detecteren van kleine genetische varianten in long-read RNA-sequencingdata. RNA-analyse is complex doordat RNA-editing en technische fouten de interpretatie van mutaties kunnen vertroebelen.
Het nieuwe algoritme weet met behulp van deep learning onderscheid te maken tussen echte genetische varianten en biologische of technische ‘ruis’. Daarmee kunnen onderzoekers en clinici gelijktijdig genexpressie én mutaties analyseren, met een nauwkeurigheid die tot nu toe niet haalbaar was. Dit is met name relevant voor onderzoek naar ziekteprocessen, kankerbiologie en de ontwikkeling van gepersonaliseerde therapieën.
Bewezen AI-ecosysteem
ClairS-TO en Clair3-RNA maken deel uit van de bredere Clair-serie, een verzameling open-source AI-tools voor genomische analyse die door het team van Luo is ontwikkeld. Eerdere algoritmen, waaronder Clair3, gelden inmiddels als industriestandaard voor het verwerken van derde generatie sequencingdata. De tools staan bekend om hun snelheid, robuustheid en precisie en zijn wereldwijd al meer dan 400.000 keer gedownload door onderzoeksinstituten en sequencingbedrijven.
Volgens Luo hebben de nieuwe algoritmen “een stevig fundament gelegd voor deep-learninggedreven mutatie-ontdekking en de verdere adoptie van precisiegeneeskunde en klinische genomica versneld”.
Impact op zorg en onderzoek
De combinatie van hogere nauwkeurigheid, lagere kosten en bredere toepasbaarheid markeert een belangrijke stap richting meer toegankelijke en betrouwbare genetische analyse. De technologie heeft potentieel om kankerdiagnostiek te verbeteren, gepersonaliseerde behandelstrategieën te ondersteunen en genomisch onderzoek te versnellen. Daarmee vertaalt deze AI-gedreven innovatie zich niet alleen naar wetenschappelijke vooruitgang, maar ook naar tastbare voordelen voor patiënten en zorgsystemen wereldwijd.
Vorig jaar slaagden onderzoekers van het LUMC erin nieuwe inzichten te verkrijgen in de erfelijke spierziekte facioscapulohumerale spierdystrofie (FSHD). Zij onderzochten of het eiwit DUX4 in aangedane spiercellen dezelfde genen activeert als tijdens de embryonale ontwikkeling. Daarbij analyseerden ze het mRNA dat ontstaat na activatie van DUX4, met specifieke aandacht voor alternatieve splicing, waarbij één gen meerdere mRNA-varianten kan vormen.
Promovendus Dongxu Zheng ontdekte dat de mRNA-isovormen in FSHD-spieren sterk lijken op die uit het embryo, maar subtiele verschillen vertonen. Dit suggereert dat DUX4 in spierweefsel andere biologische effecten heeft dan tijdens de ontwikkeling. Met behulp van long-read RNA-sequencing konden de onderzoekers volledige mRNA-moleculen uitlezen, wat een nauwkeuriger beeld gaf van de ziekteprocessen in FSHD-spieren.