Kunstmatige intelligentie (Artificial Intelligence, AI) is een buzzword. Mede vanwege de hype rondom ChatGPT was er nooit eerder zoveel aandacht voor het ‘crunchen’ van data, en het door AI over laten nemen van menselijke taken. Ook in de zorg geeft dit hooggespannen verwachtingen bij patiënten en zorgverleners. Als je de medische literatuur van de afgelopen jaren bestudeert, lijkt het alsof de mogelijkheden eindeloos zijn. Waarom merkt de zorgverlener daar dan zo weinig van in de dagelijkse praktijk? Waar blijft de computer die de zorgverlener ondersteunt in het diagnostisch proces?
Een keten van data naar waarde
AI is een vorm van data-analyse die goed kan omgaan met grote en complexe datasets om inzichten te genereren op basis van patroonherkenning. Er zijn twee belangrijke redenen waarom AI momenteel zo’n hoge vlucht neemt. Allereerst is er veel data beschikbaar in een digitaal formaat, daarnaast is de computerkracht die nodig is voor het analyseren van de data nu ook beschikbaar. Als het doel van data-analyse is om kennis te vergaren, zoals in wetenschappelijke studies naar de oorzaken van ziekte, kan het genereren van een nieuw inzicht uit data een belangrijk eindpunt zijn. Echter, om van data te komen tot waarde voor de patiënt of de zorgverlener, is niet alleen het analyseren van data, maar ook het genereren van relevante inzichten die aanzetten tot handelen van belang (Figuur 1). Hiervoor worden eerst data geanalyseerd, zo nodig met de hulp van AI, om te komen tot een inzicht.
De bekendste voorbeelden van dit soort inzichten zijn predictiemodellen, waarbij bijvoorbeeld de aanwezigheid van een ziekte wordt voorspeld (diagnostisch predictiemodel) of de kans op het ontstaan van ziekte (prognostisch predictiemodel). Zo’n predictiemodel kan vervolgens worden ingebouwd in software voor klinische beslisondersteuning, waarbij de zorgverlener maximaal wordt ondersteund in de vervolghandeling. Er zijn modellen die aan de hand van richtlijnen zorgverleners zelf kunnen wijzen op een diagnose: zo bestaat er een richtlijn voor het vaststellen van acute nierschade die gemakkelijk kan worden ingebouwd in het laboratoriuminformatiesysteem, wat we recent in het UMC Utrecht hebben gedaan [1]. Om de vervolghandeling maximaal te ondersteunen wordt de zorgverlener in dit klinisch beslisondersteuningssysteem gewezen op de behandelopties voor acute nierschade en het belang van het vervolgen van de nierfunctie. Handelen kan ook niet-handelen betekenen: zo kan bijvoorbeeld aan de hand van een diagnostisch predictiemodel voor de afwezigheid van coronaire hartziekten het maken van beeldvorming worden heroverwogen, als het model de ziekte met grote zekerheid van uitsluiten [2]. Hierbij bestaat de waarde niet alleen uit het besparen van onnodige röntgenstraling voor de patiënt, maar ook uit het besparen van dure diagnostische middelen voor het gezondheidssysteem.
Het klinische plaatje: een korrelige foto
De meeste AI-modellen in de zorg worden gebouwd op data die ligt opgeslagen in elektronische patiëntendossiers: routinezorgdata. Het hergebruik van routinezorgdata heeft veel voordelen ten opzichte van data die is verzameld voor wetenschappelijk onderzoek. Zo zijn er grote hoeveelheden van beschikbaar en is er bijvoorbeeld in de meeste gevallen minder sprake van een selecte populatie, omdat er geen gebruik is gemaakt van in- en exclusiecriteria voor een studie. Daarmee is het analyseren van routinezorgdata een aantrekkelijke optie voor ontwikkelaars van AI-modellen. Helaas wordt het samenstellen van datasets en het ontwikkelen van de modellen vaak uitbesteed aan enkel IT-ontwikkelaars zonder kennis van ziekte en zorg. Het probleem dat hiermee onvoldoende wordt onderkend is te omschrijven aan de hand van een korrelige (‘pixelated’) foto (Figuur 2a-c). In werkelijkheid is er een context waarbinnen routinezorgdata ontstaan. Deze data zijn belangrijk, maar niet de enige bron van informatie in het zorgproces; er is de patiënt en diens klachten, symptomen en algemene indruk, en er is een arts die deze informatie met een klinische blik in een bepaalde context interpreteert.
Het doel voor het vastleggen van deze informatie door de zorgverlener, maar ook het rapporteren van uitslagen door ondersteunende specialismen, is dan ook niet om het klinische plaatje tot in het grootste detail vast te leggen, maar om het proces van zorg verlenen mogelijk te maken. Een elektronisch patiëntendossier is een bijzondere combinatie van verslaglegging van communicatie met anderen (verwijsbrieven, ontslagbrieven) en communicatie met jezelf als zorgprofessional (klinische notities met voorgeschiedenis, anamnese, werkdiagnoses en ingezet beleid), aangevuld met deels door mensen geïnterpreteerde gegevens uit machines (laboratoriumwaardes, radiologie-uitslagen). Daarbovenop is het vastleggen van sommige gegevens wettelijk verplicht, bijvoorbeeld een BSN voor identificatie van de patiënt of de besproken operatiecomplicaties voor het afdekken van juridische risico’s. Ook kan vastlegging worden geëist door zorgverzekeraars om vergoedingen te kunnen innen (DBC’s).
In de toekomst kunnen Persoonlijke GezondheidsOmgevingen (PGO’s) hier nog zelf-verzamelde gegevens van bijvoorbeeld de smartwatches of smartapps van patiënten aan toevoegen. Geen van de individuele datapunten die een patiënt op die manier ‘verzamelt’ tijdens zijn of haar diagnostische of therapeutische traject is vastgelegd om samen met de datapunten van duizenden anderen hergebruikt te worden voor het ontwikkelen van AI-modellen. Deze data zijn namelijk op zichzelf staand, dus zonder de betrokkenen en de context, weliswaar een afspiegeling van de werkelijkheid, maar ze zijn nooit helemaal compleet en ze kunnen makkelijk verkeerd worden geïnterpreteerd: een korrelige foto. Deze foto is bovendien om bovengenoemde redenen beter te beschouwen als een foto van het zorgproces dan van de daadwerkelijke ziekte van de patiënt. Door deze data zonder voorbewerking te analyseren, worden dus modellen gebouwd op een afspiegeling van de werkelijkheid. In het beste geval vormen de beschikbare datapunten een korrelige foto waarin de patiënt en de ziekte nog relatief gemakkelijk te herkennen zijn, in het slechtste geval is de foto te korrelig om er nog een klinisch plaatje uit te kunnen herleiden. Het AI-model dat gemaakt wordt op deze data is dan helemaal geen goed model, of zoals de vakliteratuur het treffend samenvat: ‘garbage in is garbage out’.
De rol van multidisciplinaire voorbewerking
Het maken van AI-modellen die niet klinisch toepasbaar zijn, gebeurt aan de lopende band omdat het voorbewerken van de data ontzettend tijdrovend is en de afwezigheid van klinische relevantie door de wetenschappelijke literatuur onvoldoende wordt onderkend. Bovendien zijn er voor het reconstrueren van het klinische plaatje uit de korrelige foto mensen nodig die verstand hebben van de ziekte en het zorgproces. Alleen zo kan immers de vraag beantwoord worden ‘waarom bestaat dit datapunt?’ of, soms belangrijker: ‘waarom mist hier informatie?’. Het gebruik van interoperabiliteitsstandaarden voorziet hier niet in: een goed en uniform gedefinieerd datapunt kan alsnog de relevante context missen. Het zorgvuldig selecteren en voorbewerken van de routinezorggegevens is ten slotte ook nog eens vraagstelling-afhankelijk. Voor sommige vraagstellingen is het belangrijker om een patiëntenpopulatie te definiëren die een bepaalde ziekte heeft, terwijl het voor andere vraagstellingen belangrijker is om met meer zekerheid te weten dat bepaalde patiënten de ziekte niet hebben. De reconstructie van het klinische plaatje uit routinezorgdata wordt ook met de grootst mogelijke moeite nooit perfect. Maar multidisciplinaire teams, waarin AI-ontwikkelaars samenwerken met datatechnici die verstand hebben van het zorgproces onder regie van zorgverleners, kunnen vaak een voor de vraagstelling relevante representatie van de werkelijkheid samenstellen. Dit is de werkwijze van het team rond de Utrecht Patient Oriented Database (UPOD) in het UMC Utrecht [3,4,5,6].
Mogelijkheden voor de diagnostiek
Voor de diagnostiek biedt AI veel mogelijkheden. Momenteel wordt er in de pathologie en radiologie al gebruikgemaakt van AI-gebaseerde software om de patholoog en radioloog te ondersteunen. Ook in de laboratoriumgeneeskunde wordt AI al langere tijd gebruikt: zo bevat een hemocytometer, een van de belangrijkste machines op het laboratorium, een algoritme om de verschillende componenten van een bloedbeeld te kunnen bepalen. Deze modellen kunnen relatief eenvoudig ontwikkeld worden omdat de benodigde gegevens door machines op een relatief eenduidige manier worden gegenereerd. Routinezorgdata die zijn voorbewerkt in een multidisciplinair team vormen voor recentere ontwikkelingen een belangrijke basis. Het wordt namelijk nog spannender als al deze verschillende diagnostische datastromen gecombineerd geanalyseerd kunnen worden door AI: multimodale data-gedreven integrale diagnostiek7. Het gebruik van AI in de diagnostiek heeft zonder twijfel een veelbelovende toekomst. Maar alleen als de onderliggende data in multidisciplinaire teams wordt voorbewerkt, zullen de diagnostische modellen de zorgverlener uiteindelijk kunnen ondersteunen in de klinische praktijk.
- https://pubmed.ncbi.nlm.nih.gov/37501175/
- https://pubmed.ncbi.nlm.nih.gov/36713995/
- https://www.datavoorgezondheid.nl/documenten/publicaties/2021/07/15/hulpmiddel-handelingsruimte-waardevolle-ai-voor-gezondheid
- https://pubmed.ncbi.nlm.nih.gov/17243908/
- https://pubmed.ncbi.nlm.nih.gov/36399373/
- https://pubmed.ncbi.nlm.nih.gov/30888324/
- https://pubmed.ncbi.nlm.nih.gov/30875155/