Kunstig intelligens kan forudsige snarlig død - forskerne ved ikke hvorfor

Kunstig intelligens kan forudsige et menneskes risiko for at dø indenfor et år ved hjælp af et EKG. Selv for patienter, som lægerne ellers havde frikendt i kraft af, hvad de anså som et normalt EKG. Hvorfor er et mysterium ifølge forskerne.

De amerikanske forskere undersøgte 1.77 millioner EKG’er fra 400.000 mennesker ved hjælp af kunstig intelligens. Spørgsmålet lød, hvor mange af disse mennesker er i risiko for at dø inden for et år. Computeren vandt over forskerne og forudsagde et signifikant mere rigtigt antal dødsfald. Selv for mennesker hvor forskerne ikke diagnosticerede problemer på patienternes EKG.

Forsøgets leder, læge Brandon Fornwalt, og hans kollegaer præsenterede deres forskningsresultater på The American Heart Association’s kongres i Dallas 16. november, men siger til magasinet New Scientist, at de ikke aner, hvorfor de mest retvisende forudsigelser fremkom ved brug af kunstig intelligens. Ligesom de heller ikke ved,  hvordan den kunstige intelligens kunne diagnosticere abnorme tilstande, som lægerne vurderede til at være normale. Tre kardiologer, som uafhængigt af hinanden udførte review på de tilsyneladende normalt udseende EKG’er, var ude af stand til at identificere det risikomønster, som den kunstige intelligens fangede.

"Vores fund kunne forstås sådan, at den kunstige intelligens ser ting, som mennesker formentligt ikke kan se, eller i det mindste, at den ser noget, som vi bare ignorerer, fordi vi tænker, at det er normalt," lyder et bud på en forklaring fra Fornwalt, som tilføjer:

”Kunstig intelligens kan potentielt lære os ting, som vi måske har mistolket i årtier.”

Forskerholdet trænede to versioner af den kunstige intelligens. I den ene algoritme blev der kun oplyst de rå EKG-data. I den anden udgave blev algoritmen også fodret med oplysninger om patientens køn og alder.

 Forskerne målte den kunstige intelligens resultater ved hjælp af den metriske variabel, AUC, som måler, hvor godt en model skelner mellem to grupper af mennesker - i dette tilfælde patienter, der døde inden for et år, og dem, der overlevede. Algoritmerne scorede konsekvent over 0,85, hvor en perfekt score er 1 og en score på 0,5 indikerer ingen forskel mellem de to grupper. AUC'erne for modeller, der i øjeblikket bruges af læger, ligger mellem 0,65 og 0,8,” forklarer Fornwalt, hvis undersøgelse var baseret på historiske data:

”Det vil være vigtigt at demonstrere i kliniske studier, om en sådan algoritme forbedrer patientens outcome,” siger Christopher Haggerty, som også står bag  studiet.