Slimme tekstanalyse voor vroegtijdige kankersignalering bij mensen met een verstandelijke beperking
Hoe maak je ongestructureerde tekstdata uit het cliëntdossier (ECD) bruikbaar voor de praktijk? Jasper — arts met een tech-hart en promovendus binnen Carmenda en Sterker op eigen benen (Radboudumc) — werkt aan onderzoek dat precies daarover gaat. Met slimme tekstanalyse wil hij vroege signalen van kanker beter opsporen bij mensen met een verstandelijke beperking (VB). Dit doet hij door patronen te zoeken in teksten die zorgprofessionals dagelijks noteren.
Maak kennis met Jasper
Jasper studeerde geneeskunde in Nijmegen en later Epidemiologie in Maastricht, maar werd net zo blij van programmeren en modellen bouwen. “Een uit de hand gelopen hobby” vertelt hij. Toen hij na zijn studie aan de slag ging als arts, merkte hij dat hij de uitdaging miste in zijn werk. “Onderzoek had altijd al mijn interesse en dat in combinatie met het technische aspect, was een reden dat ik reageerde op de vacature die voorbijkwam bij Sterker op Eigen Benen. Ik dacht eerst dat ik geen kans maakte, maar uiteindelijk heb ik toch gereageerd en ben ik aangenomen. In deze rol sla ik twee vliegen in 1 klap: ik mag mij bezighouden met gezondheidszorg en technologie en dat voor een doelgroep die te vaak over het hoofd wordt gezien en waar dus veel gezondheidswinst te behalen is”.
Longitudinale tekstanalyse
Zijn promotietraject bestaat uit vier individuele onderzoeken. De rode draad: longitudinale tekstanalyse van elektronische cliënten dossiers (ECD’s) — de observaties en verslagen die door de tijd heen worden geschreven door zorgprofessionals in kaart brengen en analyseren.
Studie 1: Review
In deze fase onderzoekt Jasper welke methoden er al bestaan om teksten over langere tijd te analyseren. Hij kijkt hiervoor verder dan alleen de zorg, zoals bijvoorbeeld de technische en financiële sector. De informatie hieruit wordt gebruikt om een inschatting te maken van de methoden en aanpakken die in de volgende studies nuttig zouden kunnen zijn. Door breder te kijken dan alleen de medische sector, worden voortgangen op vergelijkbaar vlak op andere plekken ook meegenomen.
Studie 2: Beschrijving van de gegevens
Hoe zien de beschikbare tekstgegevens eruit, waar zitten de haken en ogen, en hoe bereid je dit soort data verantwoord voor? Het doel: een praktische aanpak waar andere organisaties later op kunnen voortbouwen. Niet alleen geeft dit een inkijk in de gegevensstructuur, maar maakt dit ook dat toekomstig onderzoek met deze gegevens laagdrempeliger wordt.
Studie 3: Typen kanker voorspellen
Met verschillende AI-/ML-methoden (waaronder taalmodellen) patronen leren herkennen die kunnen wijzen op vroege kankersignalen (leukemie, borst-, darm-, long-, cervix-, huid- en blaaskanker). Dit gebeurt iteratief: dus proberen, vergelijken en verbeteren. Hierbij worden afwegingen gemaakt over welke methoden het meest geschikt zijn. Daarbij wordt niet alleen gekeken naar hoe het model functioneert, maar ook of de resultaten bijvoorbeeld uitlegbaar zijn.
Studie 4: Vervolgstudie
Afhankelijk van de resultaten van onderzoek 3 wordt het vierde onderzoek vormgegeven.
Het belang van vroegtijdige signalering van kanker bij mensen met een VB
Mensen met een VB worden nog te vaak te laat gezien in het oncologische zorgpad. Dat weten we o.a. uit eerder onderzoek. Vroege signalen staan vaak wel in het dossier, maar verspreid én in vrije tekstvelden. Dit maakt het lastiger om deze op te merken en op tijd aan de bel te trekken. Deze ongestructureerde data worden gelezen voor een AI / ML model die patronen en veranderingen daarin snel(ler) boven water krijgt.
De uitlegbaarheid van het onderzoeksmodel
Jasper is scherp op uitlegbaarheid (explainable AI). Een model dat ‘hoog risico’ roept zonder onderbouwing, daar heb je in de zorg weinig aan. Daarom ligt er extra aandacht bij het gebruik van methoden die laten zien welke woorden, patronen of trends door de tijd heen belangrijk zijn voor een model.
Het veilig gebruiken van cliëntgegevens
Alle gegevens worden gepseudonimiseerd verwerkt door middel van de privacytool. Namen en direct herleidbare informatie gaan eruit vóórdat er wordt geanalyseerd, zodat de privacy van cliënten zo goed mogelijk wordt gewaarborgd. Waar mogelijk sluit het onderzoek van Jasper aan op bestaande tools en dataroutes.
Toekomst
Waar hoopt Jasper over 4 jaar te staan? “Ik hoop dat we dan een model hebben dat aantoonbaar helpt bij vroege signalering van verschillende soorten kanker én dat we vervolgens ook kunnen uitleggen. Dan liggen de randvoorwaarden er om dit samen met zorgorganisaties door te vertalen naar de praktijk.”


