Een onderzoeksteam van Stanford University heeft een belangrijke doorbraak gerealiseerd in de ontwikkeling van brain-computerinterfaces (BCI’s): voor het eerst is het gelukt om innerlijke spraak, de stille, interne stem waarmee mensen in gedachten spreken, realtime te decoderen met een nauwkeurigheid van 74 procent. Deze innovatie biedt veelbelovende perspectieven voor mensen met ernstige spraak- en motorische beperkingen, zoals patiënten met ALS of hersenstamletsel.
Traditionele BCI-systemen zijn al in staat deze 'innerlijke spraak' om te zetten in tekst. Dat kan zelfs wanneer spraak fysiek niet meer mogelijk is. Deze systemen maken gebruik van implantaten in hersengebieden die betrokken zijn bij motoriek of spraakproductie. De gebruiker probeert hardop te spreken, en de BCI zet de bijbehorende hersensignalen om in woorden. Hoewel deze aanpak aanzienlijk sneller is dan alternatieven zoals de zogenoemde oogvolgsystemen, blijft het een intensief proces voor mensen met beperkte spiercontrole. Onderzoekers van Stanford vroegen zich af of het mogelijk zou zijn om een stap verder te gaan: het decoderen van spraak zonder enige fysieke actie, puur op basis van innerlijke spraak. De bevindingen van hun onderzoek zijn onlangs gepubliceerd in Cell.
AI ontcijfert gedachten
Bij vier deelnemers met volledige verlamming werden micro-elektroden geïmplanteerd in de motorische cortex, een hersengebied dat actief is bij spraakproductie. Deelnemers werd gevraagd om bepaalde woorden hardop te proberen te zeggen, maar ook om ze slechts in gedachten uit te spreken. De neurale data die hierbij vrijkwam, werd gebruikt om een AI-model te trainen.
Hoewel innerlijke spraak een zwakkere hersenactivatie genereert dan echte spraakpogingen, bleken de neurale patronen voldoende herkenbaar. In een proof-of-concept kon het systeem ingebeelde zinnen uit een vocabulaire van 125.000 woorden met 74 procent nauwkeurigheid decoderen.
Innerlijke spraak op commando
Een opvallende toevoeging aan het onderzoek is een beveiligingsmechanisme waarmee gebruikers de decodering van innerlijke spraak kunnen activeren met een zelfgekozen wachtwoord. In het experiment gebruikten deelnemers de zin "chitty chitty bang bang" als activeringscode. Het systeem herkende deze 'gedachtenwachtzin' met een betrouwbaarheid van meer dan 98 procent, wat wijst op de mogelijkheid om innerlijke spraakselectie veilig en bewust te controleren.
Daarnaast toonde het team aan dat innerlijke spraak en spraakpogingen subtiel verschillende neurale patronen genereren. Een inzicht dat BCI’s in staat stelt om beide toestanden van elkaar te onderscheiden, en zo alleen gewenste communicatie te vertalen.
Natuurlijke interactie voor iedereen
Hoewel het decoderen van vrije innerlijke spraak op dit moment nog beperkingen kent, benadrukken de onderzoekers dat snellere hardware, fijnmazigere sensoren en verbeterde algoritmes dit in de nabije toekomst sterk kunnen verbeteren.
“Voor mensen die volledig niet kunnen spreken, brengt dit onderzoek ons een stap dichter bij vloeiende, natuurlijke communicatie via gedachten,” zegt senior onderzoeker Frank Willett. “De toekomst van spraak-BCI’s ligt in technologie die voelt als een gewoon gesprek.” Deze innovatie opent de deur naar een nieuwe generatie spraakinterfaces, waarbij mensen met ernstige beperkingen hun stem, en hun autonomie, kunnen herwinnen, puur door te denken.
Eind vorig jaar berichtten wij over een Amerikaans experiment waarbij een ALS met behulp van een BCI met zijn omgeving kon communiceren via een Amazon Alexa (vergelijkbaar met de Google Home) speaker. De BCI las als het ware de gedachten van de patiënt en vertaalde die in gesproken tekst.