Bij het Barcelona Supercomputing Center (BSC) – de thuisbasis van een van Europa's krachtigste supercomputers, MareNostrum 5 – past Davide Cirillo, hoofd van de Machine Learning for Biomedical Research Unit, kunstmatige intelligentie toe op onderzoek naar kanker, zeldzame ziekten, hart- en vaatziekten en neurodegeneratieve aandoeningen. We spraken met hem over datagestuurde ontdekkingen in de biogeneeskunde en de grootste knelpunten in wetenschappelijk onderzoek op basis van AI.

Wat is uw rol bij het BSC?

Mijn onderzoeksgroep gebruikt kunstmatige intelligentie om verschillende problemen in de biogeneeskunde aan te pakken, bijvoorbeeld om onderzoek naar kanker, zeldzame ziekten, hart- en vaatziekten en neurodegeneratieve aandoeningen te versnellen. We bestrijken het volledige spectrum van biomedische toepassingen met behulp van AI, werken met diverse soorten gegevens, waaronder omics-gegevens, tekstuele en beeldgegevens, en leveren een bijdrage aan tal van Europese en nationale AI-gerichte projecten.

Welke recente doorbraken in de praktijk hebt u gezien waarbij AI ontdekkingen in biomedisch onderzoek heeft versneld?

We zijn getuige van een transformatie van ons onderzoeksdomein en onze manier van werken. Dit is echt een paradigmaverschuiving.

Ik zal uitleggen waarom. Historisch gezien was veel wetenschap hypothese-gedreven. Onderzoekers formuleerden een hypothese en verzamelden vervolgens gegevens om te evalueren of het bewijs deze hypothese ondersteunde of weerlegde. Zo is veel wetenschappelijk onderzoek in het verleden verlopen. In het biomedische domein, vooral na de eerste publicatie van het menselijk genoom in 2001, ontdekten we een nieuw niveau van complexiteit, met een overvloed aan gegevens die we konden genereren met behulp van high-throughput experimentele technieken. Dit leverde ons veel meer informatie op dan we hadden kunnen verwachten met een puur hypothese-gedreven aanpak.

Deze revolutie luidde een nieuw tijdperk in van datagestuurd wetenschappelijk onderzoek. Tegenwoordig is dit ongetwijfeld de dominante aanpak, niet alleen in de biogeneeskunde en de gezondheidszorg, maar ook op veel andere gebieden. Denk bijvoorbeeld aan grote taalmodellen en alle vooruitgang die we zien. Die modellen zijn gebaseerd op een groot dataverbruik en zijn afhankelijk van een hoge rekenkracht. De paradigmaverschuiving bestaat uit een overgang van het testen van vooraf gedefinieerde hypothesen naar het doorzoeken van enorme hoeveelheden informatie om nieuwe inzichten te genereren.

We ontdekken veel, vooral op mechanistisch niveau, over hoe ziekten werken en wat ten grondslag ligt aan hun manifestatie en progressie. Dit is zeer nuttig voor de ontwikkeling van nieuwe behandelingen. Dergelijke technologische doorbraken hebben echter ook ernstige implicaties.

Ten eerste hebben we, als we al deze gegevens produceren, grotere modellen en adequate infrastructuur nodig om ze te verwerken. Dit roept vragen op over de duurzaamheid van het milieu en mogelijke afhankelijkheid van particuliere bedrijven die over de financiële middelen beschikken om deze infrastructuur te leveren. In dit verband is het Barcelona Supercomputing Center een voorbeeldig geval: het is een openbaar onderzoeksinstituut met eersteklas rekencapaciteit, en MareNostrum 5 behoort tot de groenste supercomputers ter wereld. Helaas wordt elders niet altijd aan zulke hoge normen voldaan.

Ten tweede wordt het bij het verwerken van zoveel informatie gemakkelijker om belangrijke kwesties uit het oog te verliezen, zoals vooroordelen in de gegevens, in het modelleringsproces of in de manier waarop modellen worden geleverd en gebruikt in de samenleving. Grote AI-modellen zijn vaak black boxes die gedurende hun hele ontwikkelingscyclus grondig moeten worden gecontroleerd, in overeenstemming met de ethische richtlijnen voor verantwoorde AI die het BSC promoot en toepast in al zijn projecten. Dus ja, de paradigmaverschuiving is krachtig en impactvol, maar vereist een zorgvuldige afweging van deze aspecten.

Heeft u, nadat DeepMind's AlphaFold in 2024 een Nobelprijs kreeg, meer zichtbaarheid en financiering voor AI-gedreven biomedisch onderzoek gezien?

Zeker, maar de Nobelprijs en de media-aandacht zijn niet de enige drijfveren. Er zijn veel kanalen waarmee wetenschappelijke ontwikkelingen een breed publiek kunnen bereiken. Vroeger las je misschien over een nieuwe ontdekking in de krant. Nu kun je wetenschappelijke doorbraken direct en regelmatig zien op veel platforms, zelfs op sociale netwerken. Deze toegenomen zichtbaarheid gaat gepaard met economische overwegingen.

De ontwikkeling van geneesmiddelen wordt al lang bepaald door economische krachten, waarbij farmaceutische bedrijven als pijlers van de industrie fungeren. Wat nu verandert, is de toetreding van technologiebedrijven tot de biomedische sector. Zo zijn GPU's, oorspronkelijk ontwikkeld voor grafische verwerking in de jaren negentig, essentiële hulpmiddelen geworden in biomedisch onderzoek. Hoewel deze technologieën oorspronkelijk niet specifiek voor biomedische toepassingen waren ontworpen, hebben farmaceutische bedrijven ze snel overgenomen om AI-gestuurde geneesmiddelenontwikkeling te ondersteunen.

Dit stimuleert innovatie doordat bedrijven kansen in de gezondheidszorg kunnen verkennen.

Het is echter nuttig om drie niveaus te onderscheiden. Het eerste is academisch en industrieel onderzoek, waar AI wordt ontwikkeld en beschreven in peer-reviewed artikelen en octrooien. Het tweede is het markt- en regelgevingsniveau, waar op AI gebaseerde software goedkeuringsprocedures heeft doorlopen, zoals goedkeuring door de FDA in de Verenigde Staten of naleving van de MDR in Europa. Het derde is de daadwerkelijke toepassing, dat wil zeggen welke commerciële AI-software ziekenhuizen daadwerkelijk aanschaffen en in de praktijk gebruiken.

Op marktniveau is ongeveer 80 procent van de AI-producten in de gezondheidszorg gericht op medische beeldvorming. Ongeveer 10 procent richt zich op hart- en vaatziekten en het resterende deel is verdeeld over andere medische gebieden. Maar als je kijkt naar gezondheidszorgsystemen wereldwijd, blijft het gebruik in ziekenhuizen beperkt, hoewel het toeneemt.

In de Verenigde Staten had in 2025 bijvoorbeeld ongeveer 22 procent van de ziekenhuizen al een of andere vorm van AI in gebruik. Dat is nog niet universeel, maar het neemt jaar na jaar toe. De meest gebruikte toepassingen zijn zeer praktisch. Ambient AI-systemen die gesprekken tussen artsen en patiënten opnemen en samenvattingen genereren, behoren tot de meest gebruikte. Ziekenhuizen passen AI toe voor efficiëntie en voor zeer specifieke taken.

Hoe hebben grote taalmodellen en basismodellen het biomedisch onderzoek sinds 2022 veranderd? Veranderen ze de manier waarop we hypothesen genereren?

Ze zijn zeer revolutionair geweest. Het is interessant dat de soorten gegevens die AI momenteel aansturen, voornamelijk afbeeldingen en tekst zijn. Dit geldt ook voor de biogeneeskunde.

Grote taalmodellen zijn zeer nuttig voor het verwerken van medische aantekeningen en andere tekstuele informatie die in klinische omgevingen wordt verzameld. Dit omvat vrije tekst in elektronische medische dossiers en audio, wat onder de noemer natuurlijke taalverwerking valt.

Waarom afbeeldingen en tekst? Deze soorten gegevens zijn breder beschikbaar en gemakkelijker toegankelijk. Grote taalmodellen zijn zeer complex, met miljarden parameters, en vereisen grote hoeveelheden gegevens. Het ontwikkelen van vergelijkbare modellen voor nichegegevens met beperkte beschikbaarheid is aanzienlijk uitdagender.

In beeldvorming worden basismodellen een totaaloplossing voor veel taken. Je kunt ze nauwkeurig afstemmen voor beeldsegmentatie. Je kunt hun embeddings gebruiken om synthetische beelden te genereren. Een basismodel is kneedbaar. Je kunt het hergebruiken voor verschillende taken in beeldverwerking. Dit sluit aan bij de bredere big data-benadering, waarbij we zoveel mogelijk willen leren van gegevens en die kennis vervolgens op verschillende manieren willen toepassen. Hetzelfde principe dat begon met genomica, is nu van toepassing op andere soorten gegevens met een hoge doorvoercapaciteit.

Wat vertraagt momenteel de vooruitgang in AI-gedreven levenswetenschappen? Regelgeving, gebrek aan middelen, gebrek aan gegevens?

Meer dan regelgeving, die ik noodzakelijk acht, is het gebrek aan middelen, met name financiering, de belangrijkste beperking. Onderzoek is complex en vereist financiering. Verkenning is inherent aan onderzoek. Als we het hebben over onderzoek, markt en acceptatie, is onderzoek de fase waarin je onderzoekt wat mogelijk is. Dit leidt tot innovatie en nieuwe producten, maar vereist investeringen op nationaal en mondiaal niveau. De wetenschap heeft betere economische ondersteuning nodig.

Regelgeving kan processen vertragen, maar vereist terecht veiligheid en doeltreffendheid. Zonder regelgeving zou het een ongecontroleerde omgeving zijn waar ontwikkelingen ernstige risico's zouden kunnen opleveren. De geschiedenis van de ontwikkeling van geneesmiddelen laat dit duidelijk zien. Er zijn strenge regelgevingskaders opgesteld om schade te voorkomen. In AI voor de gezondheidszorg zien we voorbeelden die de noodzaak van waarborgen onderstrepen. De noodzaak van regelgeving is geen belemmering voor vooruitgang. Het is iets dat verantwoorde vooruitgang mogelijk maakt.

Data is een ander probleem. We hebben het over big data, maar we hebben niet altijd voldoende data, vooral bij zeldzame ziekten. Zelfs bij veelvoorkomende ziekten werken we met kleinere datasets naarmate we evolueren naar precisiegeneeskunde en subgroepen definiëren. Het produceren van high-throughput data is duur. Technologieën zoals ruimtelijke transcriptomica maken bijvoorbeeld een analyse met hoge resolutie van weefsel- en genexpressie op bijna celniveau mogelijk. Dit is uiterst krachtig, maar ook erg duur.

Onderwijs en talent zijn ook van cruciaal belang. We moeten onderwijs stimuleren en talent in onderzoek behouden. Als de middelen beperkt zijn, wordt het moeilijk om de volgende generatie onderzoekers aan te werven en op te leiden. AI en engineering zijn van oudsher door mannen gedomineerde vakgebieden. Meer inclusieve teams brengen nieuwe ideeën en helpen vooroordelen te verminderen. Investeren in gelijkwaardig onderwijs en diversiteit is essentieel.

Versnelt AI de ontwikkeling van geneesmiddelen al?

AI maakt al deel uit van de toolkit in farmaceutisch onderzoek. Het wordt gebruikt in preklinische stadia en in klinische proeven. AI ondersteunt bijvoorbeeld de ontdekking van geneesmiddelen door farmacokinetische eigenschappen te voorspellen en moleculaire structuren te optimaliseren. Ook kan het helpen bij het werven van patiënten voor klinische proeven, waardoor deze gerichter en nauwkeuriger worden. Dit is vooral belangrijk voor precisiegeneeskunde. Tegelijkertijd zijn deze systemen niet volledig autonoom; mensen zorgen voor ethische toetsing, complexe beoordelingen en naleving van regelgeving, zoals vereist door kaders zoals de AI-wet.

Er is ook een groeiend momentum rond New Approach Methodologies (NAM's) die gericht zijn op het verminderen van het gebruik van diermodellen, waaronder in-vitrobenaderingen, zoals organoïden, en in-silicomethoden, zoals de op AI gebaseerde methoden die we ontwikkelen in het Barcelona Supercomputing Center.

Waar kijkt u naar uit in de komende drie tot vijf jaar?

Het meest veelbelovend zijn nieuwe computationele paradigma's, zoals quantumcomputing. Bij het BSC hebben we al quantumcomputers geïnstalleerd en zijn we actief op dit gebied. Quantum machine learning is in opkomst als een nieuw vakgebied. De toepassingen in de praktijk blijven echter beperkt, omdat quantumcomputing zelf nog in een vroeg stadium van ontwikkeling verkeert. Er is nog veel werk nodig om quantumalgoritmen te ontdekken, te ontwerpen en operationeel te maken.

Technologische vooruitgang zorgt voor grote veranderingen. We zien bijna dagelijks nieuwe ontwikkelingen. De versnelling is reëel en komt uit meerdere richtingen. Maar om het volledige potentieel ervan in de levenswetenschappen te realiseren, moet dit gepaard gaan met verantwoordelijkheid, middelen, regelgeving en onderwijs.