Faktaark 09-2018

Kunstig intelligens og maskinlæring i helsesektoren


Økt bruk av informasjonssystemer i helsetjenesten og digitaliseringen av pasientinformasjon genererer store datamengder. Data er lagret i mange systemer i ulike formater. Rundt 80 prosent av helsedata er ustrukturerte.

Dataene har et stort potensial innen helsetjenesteyting (primærbruk) og kvalitetsforbedring, forskning, folkehelse, styring og planlegging (sekundærbruk).

Kombinasjonen av store mengder varierte data, økt datakraft og bedre metoder muliggjør rask og automatisert produksjon av maskinlæringsalgoritmer, som kan analysere komplekse data med nøyaktige resultater.

Fire kategorier maskinlæring

  • Ved veiledet læring lærer algoritmene ved å sammenligne sine egne prediksjoner med eksempeldata som en menneskelig «veileder» har gjennomgått og gitt korrekt svar.
  • Ved ikke-veiledet læring er målet å se underliggende strukturer eller mønstre i dataene. Treningsdataene er ikke gjennomgått på forhånd av et menneske og det finnes derfor ingen «fasit».
  • Delvis veiledet læring kombinerer bruk av en liten mengde merkede data med større mengder umerkede data.
  • Forsterkende læring innebærer at algoritmen belønnes når den tar riktig beslutning i en gitt situasjon.

Utfordringer ved maskinlæring

Algoritmen kan bli som en «svart boks» når prosessen som ligger bak resultatene er for kompleks til at vi kan forstå.

Personlige helseopplysninger må behandles på en måte som ivaretar personvernet. I henhold til GDPR må data være tilstrekkelige, relevante og begrenset til det som er nødvendig for å oppnå det formålet som dataene behandles for. Pasientene må være fullt informert om årsaken til databehandling, slik at de kan velge om de tillater bruk av dataene i en algoritme eller ikke.

Algoritmen kan produsere dårlige prediksjoner. De vanlige årsakene til dette er overtilpasning og undertilpasning. Ved overtilpasning presterer algoritmen bra på treningsdata, men dårligere på nye data fordi den har «lært» treningsdataene i stedet for å finne en generell regel som forklarer variasjonen. Undertilpasning innebærer at algoritmen generaliserer dårlig til nye data, samtidig som den fungerer dårlig også på treningsdataene. Overtilpasning og undertilpasning henger sammen. Dersom den ene reduseres vil den andre øke. Det gjelder derfor å finne en balanse mellom dem, der den totale prediksjonsfeilen er minst mulig.

Hva må til for å lykkes?

Maskinlæringssystemer er forskjellige fra tradisjonelle programvaresystemer. Maskinlæring bruker selvlærende algoritmer som forbedrer seg kontinuerlig. Systemet må trenes med lokale data før klinisk bruk. Hver algoritme har sine styrker og svakheter, derfor er det viktig å prøve flere algoritmer for å finne ut hvilke som fungerer best på det aktuelle problemet. En strategi kan være å kartlegge kliniske behov og hva som er teknologiske muligheter, for å identifisere gode case for pilotprosjekt. Piloter som viser gode resultater kan deretter skaleres opp.

Maskinlæring har blitt testet i mange forskningsprosjekter med lovende resultater. Dersom maskinlæring skal brukes til klinisk beslutningsstøtte, trengs en ferdig trent modell samt tilgang til data om enkeltpasienter. Det betyr at systemet må være integrert med elektronisk pasientjournal (EPJ) eller andre systemer der data er lagret. Dette kan gjøres på flere måter, enten ved at det bygges inn i EPJ-systemet/radiologisystemet, leveres som en skytjeneste fra en tredjepart, eller i en privat nettsky.

Hva kan det brukes til?

Bruk av maskinlæring som kan omgjøre data til kunnskap vil føre til disrupsjoner på minst tre områder innen medisin, med ulik tidshorisont [1]:

  1. Tolkning av medisinske bilder. Her har utviklingen kommet lengst. Mange prosjekter har dokumentert ytelse så godt som eller bedre enn menneskelige eksperter. Det vil skje mye på området de neste årene.
  2. Prognostikk. Algoritmer for prognostikk er ikke like modne. Det vil ta omlag fem år før dette området er modent.
  3. Diagnostikk. Dette er det mest kompliserte av områdene. Det vil ta rundt ti år før slike løsninger blir modne.

AI-teknologi kan gjøre helsetjenesten mer proaktiv, men det er behov for mer forskning og utvikling før potensialet kan realiseres fullt ut. Forskningen bør også se på problemstillinger innen etikk, personvern og informasjonssikkerhet.

Kontaktpersoner:

Alexandra Makhlysheva Alexandra Makhlysheva

Per Atle Bakkevoll Per Atle Bakkevoll

Anne Torill Nordsletta Anne Torill Nordsletta

Line Helen Linstad Line Helen Linstad

Faktaboks

Maskinlæringsalgoritmer kan analysere store mengder varierte data med nøyaktige resultater. Tre disrupsjonsområder for maskinlæring innen helse:

  • Tolkning av medisinske bilder (øyesykdommer, radiologi, patologi)
  • Prognostikk (demens, metastatisk kreft, hjerneslag)
  • Diagnostikk (onkologi, patologi, sjeldne sykdommer)

Helsetjenesten blir mer proaktiv ved hjelp av AI, likevel er det behov for mer forskning og utvikling før potensialet kan realiseres fullt ut.