Kunstmatige intelligentie (AI) speelt een steeds grotere rol in de medische beeldvorming (medical imaging), zowel nu als in de toekomst. AI biedt tal van mogelijkheden om de nauwkeurigheid en efficiëntie van diagnostische processen en hiermee patiënten uitkomsten te verbeteren. In dit artikel verkennen we welke rol AI kan spelen in het domein van de medische beeldvorming, maar kijken daarbij ook wat de risico’s en beperkingen zijn. Tenslotte zullen we kort ingaan op voorbeelden van toepassingen die nu in gebruik zijn en wat er in de nabije toekomst van AI in de medische beeldvorming mogelijk is.
Waar liggen de toepassingen?
De mogelijkheden van AI lijken op dit moment onbegrensd en overal om ons heen zien we een constante toename van het aantal concrete toepassingen van AI. De meest recente ontwikkeling die bekend is bij het brede publiek is de zogenaamde generatieve AI waarvan Chat GPT en meer recent Deep Seek, de meest bekende voorbeelden zijn. Het feit dat Chat GPT zo populair en wijdverspreid is geworden heeft tot gevolg dat veel mensen nu AI gelijkstellen aan taalmodellen zoals Chat GPT. Dat is echter een misvatting, want er is veel meer mogelijk met AI. Wij maken daarom een onderscheid tussen beeldgebaseerde AI, tekst gebaseerde AI, en multimodale AI binnen de medische context.
Beeldgebaseerde AI
Deze variant is te gebruiken voor het analyseren van medische beelden zoals röntgenfoto’s, echo’s, CT-scans en MRI’s. Maar ook voor beelden buiten het radiologisch domein zoals pathologie beelden, zichtbaar licht foto’s (bijv. dermatologie) of video (bijv. colonoscopie, endoscopie). AI-algoritmen kunnen op deze beelden patronen en afwijkingen identificeren die soms voor menselijke waarnemers moeilijk te detecteren zijn, wat kan leiden tot snellere en/of nauwkeurigere diagnoses.
Om tot die diagnose te komen kan beeldgebaseerde AI ingezet worden voor diverse taken. Bij classificatie wordt er een globaal ‘label’ toegekend aan een afbeelding. Hierbij kan bijvoorbeeld aangegeven worden dat een bepaalde afwijking zich in het beeld bevindt. Bij lokalisatie wordt op het beeld aangegeven waar de afwijking zich bevindt maar de omvang wordt niet door het model bepaald. Bij segmentatie wordt het interessegebied exact aangegeven in het beeld zelf, dus omtrek, oppervlakte of volume van de afwijking. Tenslotte wordt bij predictie op basis van beelden een voorspelling gedaan, bijvoorbeeld over de ontwikkeling van de afwijking of de effectiviteit en/of bijwerkingen van een bepaalde behandeling.
Tekst gebaseerde AI
Dit helpt bij het interpreteren van tekstgegevens uit het medisch dossier en literatuur. Deze AI-systemen kunnen grote hoeveelheden tekstuele gegevens doorzoeken en relevante informatie extraheren, wat artsen ondersteunt bij het nemen van geïnformeerde beslissingen. Een van de meest bekende voorbeelden is Chat GPT van Open.AI. Met dergelijke systemen is het mogelijk om automatisch samenvattingen te genereren van de geschiedenis van de patiënt waarbij de tekst wordt aangepast op basis van de wensen van de gebruiker met betrekking tot bijvoorbeeld lengte en taalgebruik. Meer specifiek in de radiologie kunnen dergelijke modellen helpen om relevante informatie uit het medisch dossier en eerdere verslagen te halen en trends over de tijd in kaart brengen.
Multimodale AI
Dit combineert zowel beeld- als tekstgegevens om een completer beeld van de patiënt te krijgen. Deze benadering kan bijvoorbeeld beeldgegevens van een MRI combineren met patiëntgeschiedenis, klinische notities en laboratoriumgegevens om een betere diagnose te stellen of om uitkomst van behandeling te voorspellen.
Wat zijn de risico’s en beperkingen?
Hoewel AI veel potentieel heeft, zijn er ook risico’s en beperkingen. Deze kunnen technisch van aard zijn, maar ook te maken hebben met ethische, juridische of sociale uitdagingen (het zogenaamde ELSA (Ethical Legal and Societal Aspects) concept. Een van de belangrijkste zorgen is de nauwkeurigheid van AI-algoritmen. Fouten in de analyse kunnen leiden tot verkeerde diagnoses die verstrekkende gevolgen kunnen hebben voor een patiënt. Hierbij is het belangrijk om onderscheid te maken tussen fout-positieven en fout-negatieven.
Een fout-positieve betekent dat de AI een afwijking detecteert die er in werkelijkheid niet is, wat kan leiden tot onnodige vervolgonderzoeken en angst bij de patiënt. Een fout-negatieve is daarentegen nog zorgwekkender, omdat hierbij een afwijking wordt gemist die wel aanwezig is, met mogelijk ernstige gevolgen voor de patiënt.
Technische uitdagingen
Technische uitdagingen zijn bijvoorbeeld de beperkte toegang tot kwalitatief goede data, het gebrek aan generaliseerbaarheid van modellen, de beperkte uitlegbaarheid van modellen (zogenaamde black box), acceptatie en kwaliteitscontrole van modellen, het optimaal integreren van AI in het werkproces en het monitoren van de performance van modellen over de tijd.
Bij het trainen van een deep learning is er een grote afhankelijkheid van de gebruikte data. Deze afhankelijkheid zorgt er onder andere voor dat het niet zeker is dat modellen generaliseerbaar zijn. Met andere woorden: het is niet zeker dat een model getraind in een Europese populatie werkt in China en andersom. Dit heeft tot gevolg dat de acceptatie testen en kwaliteitscontrole van modellen enorm belangrijk worden.
Daarnaast zijn er veranderingen in de omgeving (zogenaamde ‘drifts’) die invloed hebben op de werking van een deep learning model. Concept drift verwijst naar veranderingen in de onderliggende distributie van de data waarop het model is getraind, wat kan leiden tot verminderde nauwkeurigheid als het model niet wordt aangepast. Met andere woorden: de relatie tussen de input en de output verandert.
Voorbeeld in de radiologie: Stel, een model is getraind om longnodules op CT-scans te detecteren. Door nieuwe richtlijnen worden longnodules nu anders gedefinieerd of gemeten. Het model, dat is getraind op basis van de oude definitie, zal mogelijk minder goed presteren bij het herkennen van nodules volgens de nieuwe richtlijnen.
Data drift treedt op wanneer de inputdata die het model ontvangt, verschilt van de data waarop het is getraind, wat kan resulteren in onbetrouwbare voorspellingen. Hierbij veranderen de statistische eigenschappen van de inputdata die het model ontvangt. Dit kan bijvoorbeeld komen door veranderingen in de populatie patiënten, de gebruikte apparatuur of de acquisitieprotocollen.
Voorbeeld in de radiologie: Een model dat is getraind op CT-scans van een oudere generatie scanner, kan minder goed presteren op scans van een nieuwere scanner met een hogere resolutie of andere beeldkarakteristieken.
Feature drift gebeurt wanneer de statistische eigenschappen van individuele kenmerken veranderen, wat de voorspellende kracht van het model kan verminderen.
Voorbeeld in de radiologie: Stel, een model gebruikt de grootte en vorm van een longnodule als features. Door een verandering in de scan techniek worden nodules nu systematisch iets groter gemeten. Hoewel de nodules zelf niet veranderen, kan dit de prestaties van het model beïnvloeden omdat de input features veranderd zijn.
Het is essentieel om deze ‘drifts’ te monitoren en het model regelmatig bij te werken om de prestaties en betrouwbaarheid te waarborgen.
Tenslotte is een veelgehoord technisch probleem het gebrek aan uitlegbaarheid van modellen. Een model kan heel goed presteren op basis van bepaalde metriek, maar het is niet mogelijk om uit te leggen hoe het model exact tot een beslissing is gekomen. Daarom wordt er gewerkt aan methodes om meer inzicht te krijgen in het model. Een voorbeeld hiervan in beelden is de attention map. Deze laat op het beeld zien welke pixels in het beeld het meest hebben bijgedragen aan het maken van de beslissing. Dit kan de gebruiker inzicht geven of wat het model doet ook klopt met de verwachting.
Impact en kosten
Naast het technisch aspect van AI dient ook te worden gekeken naar de impact van het gebruik ervan. Helpt de AI inderdaad in het stellen van de juiste diagnose en het bepalen van een beter behandelplan? Is er echt sprake van betere patiënt uitkomsten? Verder is het van belang na te denken over de kosten die AI met zich meebrengt. Dat betreft de kosten in het ontwikkelproces maar ook de kosten van het runnen van het algoritme. Groeiende aandacht is hierbij ook voor de zogenaamde ‘carbon footprint’ die het runnen van AI met zich meebrengt. Uiteindelijk is de vraag hoe de opbrengsten van het gebruik van AI opwegen tegen de kosten ervan. Aan de hand van wetenschappelijk onderzoek dient dit te worden vastgesteld.
ELSA
Als we kijken naar de ELSA aspecten dan kan dat gaan over het ethisch verantwoord gebruik van AI, data toestemming en privacy. Daarnaast is het essentieel dat AI-systemen voldoen aan strikte wet- en regelgeving zoals (in Europa) de Medical Device Regulation, de General Data Protection Regulation en de AI-Act om de vertrouwelijkheid van medische informatie en het verantwoord gebruik van AI te waarborgen.
De uitdaging is hierbij aan de ene kant om te voldoen aan de gestelde eisen, en aan de andere kant om te bepalen hoe hieraan te voldoen. In veel gevallen bepaalt de wet- en regelgeving wel wat er gedaan moet worden maar niet hoe, en dat is vaak lastig. Een voorbeeld hiervan is de eis van kwaliteitscontrole. Hoe kunnen we deze implementeren? In veel gevallen wordt hierbij teruggegrepen op de ‘human oversight’ waarbij alles steeds door een mens wordt gecontroleerd. Als we echter stappen willen maken dan zullen we voor bepaalde AI-modellen moeten gaan accepteren dat ze juiste beslissingen nemen. Maar hoe controleren we dat dan? En hoe sluit dat aan bij de eerdergenoemde ‘drifts’? En vinden we dit ethisch verantwoord als dit doorslaggevende gevolgen kan hebben voor de behandeling van een patiënt? Dit zijn vragen die nog open staan.
De praktijk
In de praktijk wordt AI al op verschillende manieren toegepast in de medische beeldvorming. Radiologen gebruiken AI-tools om beelden te analyseren en te interpreteren, wat hen helpt om sneller en nauwkeuriger te werken. Hierbij kan worden gedacht aan het prioriteren van onderzoeken in de werklijst bij de aanwezigheid van afwijkingen. Ook kan worden gedacht aan het lokaliseren van afwijkingen, bijvoorbeeld van een fractuur op een enkelfoto (figuur 1).

Binnen de radiotherapie speelt orgaan segmentatie een belangrijke rol (figuur 2).

Ook in de pathologie en dermatologie wordt AI ingezet om beelden te beoordelen.
De toekomst
De toekomst van AI in de medische beeldvorming belooft nog meer integratie en samenwerking tussen verschillende AI-technologieën. Daarnaast moet er een steeds betere samenwerking komen tussen AI en menselijke expert, bijvoorbeeld door optimale integratie van AI en meer uitlegbaarheid. Dit zal leiden tot verbeterde patiëntenzorg en efficiëntere medische praktijken. Innovaties zoals real-time beeldanalyse en gepersonaliseerde diagnostiek zullen waarschijnlijk een grotere rol gaan spelen, waardoor artsen beter geïnformeerde beslissingen kunnen nemen en patiënten sneller en effectiever kunnen behandelen.