Data science inzetten om nierfalen na transplantatie te voorspellen: Ontmoet Max Verbeek
Onze developer Max Verbeek is recent afgestudeerd als computerwetenschapper bij de University of Groningen. Hij deed zijn afstudeerproject bij het UMCG, waar hij een predictiemodel ontwikkelde om nierfalen te voorspellen na een niertransplantatie. Voor zijn project heeft Max een 9 gekregen.
Gebruikmaken van klinische gegevens
Max: “Een belangrijke vraag na een transplantatie is hoe lang de nier meegaat. Patiënten willen dat natuurlijk graag weten, en het is ook handig om adequate zorg te kunnen bieden. Dat is nuttig, want als je ziet dat de nier niet zo lang meer mee gaat, dan kan je meteen op de wachtlijst. Het is daarom belangrijk om te kunnen voorspellen op welke termijn na de operatie de nier gaat falen.”
Max werkte voor zijn onderzoek samen met Dr. George Azzopardi van de RUG en Tamas Szili-Torok van het UMCG. Samen ontwikkelden ze een model dat klinische gegevens gebruikt om te voorspellen hoe lang de nier meegaat. Het mooie aan dit model is dat het gebruik maakt van gegevens die sowieso al worden verzameld door het ziekenhuis. Denk dan bijvoorbeeld aan leeftijd, medicatiegebruik, gewicht en of de patiënt rookt. Dit wordt verzameld van zowel de patiënt zelf als de donorpatiënt.
Max: “Het mooie daarvan is dat we het model heel laagdrempelig kunnen gebruiken. Mensen hoeven geen spannende tests te ondergaan of extra data te verzamelen.”
Uniek predictiemodel
Voor zijn afstudeerproject heeft Max het model ontwikkeld en gevalideerd op data van het UMCG. Het unieke aan dit nieuwe model is dat het heel betrouwbaar de levensduur van de nier kan voorspellen, vanaf 1 jaar na de transplantatie. Dat doen ze aan de hand van een accelerated failure time (AFT) model. Modellen uit ander onderzoek zijn juist vaak gebaseerd op survival analyse (Cox regressie). Die zijn voor mensen vaak lastiger te begrijpen, omdat ze trapsgewijs aangeven wat de kans op falen is na een bepaald aantal jaar. Max: “Je wil als patiënt juist weten hoe lang je nier nog mee gaat. Zo’n percentage zegt dan vrij weinig.”
Het model is ook bijzonder omdat het de betrouwbaarheid van de inschatting meegeeft. Dat doet het aan de hand van de ‘bagging approach’, oftwel bootstrap aggregating. Max: “Dat betekent dat we een heleboel kleine versies van het model hebben getraind op subsets van data. Zo krijgen we heel veel voorspellingen. Door de groepering van voorspellingen te bekijken kunnen we zien hoe betrouwbaar de uiteindelijke voorspelling is.” Deze methode is vrij nieuw en uniek: je hebt dus niet alleen de voorspelling, maar ook de nauwkeurigheid ervan.
Naast dat je de levensduur van de nier graag wil weten, wil je waarschijnlijk ook weten wat daar invloed op heeft. Ook dat kan met dit model, zegt Max. “We maken de modellen aan de hand van boosted decision trees (XGBoost). Dat is heel cool. Je kan dan kijken naar de vertakkingen van al die decision trees om te zien welke vertakking het meeste impact hebben. Zo kan je goed inzicht geven in welke variabelen de grootste invloed hebben op nierfalen.”
Volgende stappen
Het model is nu ontwikkeld en getest op de data van het UMCG. Een belangrijke vervolgstap is het model te testen met nog veel meer data, zodat het nauwkeuriger wordt. Omdat het vaak lastig is om als ziekenhuizen onderling data uit te wisselen, zijn Max en zijn onderzoeksgroep nu bezig om een federated learning framework op te zetten. Daardoor kan je met meerdere partijen samen een model trainen zonder dat je de data zelf uitwisselt. Hoe meer mensen meedoen, hoe beter het model wordt.
Max: "Dat is mooi voor het onderzoek naar nierfalen, maar kan natuurlijk ook veel breder gebruikt worden."
Voor zijn onderzoek programmeert Max in Python, maar het plan is om uiteindelijk ook een R-package te maken. Daar werken namelijk veel onderzoekers mee, dus dan kan het model breder gebruikt worden.
Echte implementatie in de zorg gaat nog wel even duren, denkt Max. Maar het framework dat ze nu aan het opzetten zijn, kan het in de toekomst veel makkelijker maken om predictiemodellen te trainen en te implementeren. En daar hebben ook patiënten wat aan.