logo

Når kunstig intelligens passer på person­vernet, kan den være veien til bedre helsehjelp

Innsikt i helsedata kan forandre spillereglene for forskning og pasientbehandling, men veien dit er ikke uten hinder. Ønsket om å utnytte helsedata for å gi bedre behandling og ressursbruk kolliderer ofte med strenge regler for bruk av helseopplysninger. Heldigvis åpner personvernfremmende teknologier døren for sikker og effektiv analyse av helsedata.

(Illustrasjonsfoto fra Colourbox)
(Illustrasjonsfoto fra Colourbox)

En ny forskningsrapport fra Nasjonalt senter for e-helseforskning presenterer to personvernfremmende teknologier, føderert læring og syntetiske data, og utforsker hvordan disse kan løse utfordringen med tilgang til helsedata av høy kvalitet og i tilstrekkelig mengde for forskning og tjenesteutvikling.

Helsedata: strengt bevoktet gullgruve

Helsetjenesten produserer enorme mengder data. Hvis vi bruker denne informasjonen riktig, vil det kunne hjelpe forskning, forbedre diagnostikk og sørge for at vi bruker ressursene i helsetjenesten på en smart måte. Kunstig intelligens (KI), spesielt maskinlæring, har vist seg å være et kraftig verktøy for å analysere store mengder helsedata raskt og effektivt.

Helseopplysninger er ikke bare verdifulle – men også sensitive, og bruken er sterkt regulert. Det er vanskelig å få tilgang til helsedata for sekundærbruk.

Seniorrådgiver Alexandra Makhlysheva (Foto: Nasjonalt senter for e-helseforskning).

- Å sørge for at reglene om personvern og datasikkerhet blir fulgt, tar mye tid og innsats. Dette er en stor utfordring når det gjelder å få tilgang til treningsdata og spre bruk av KI i helse- og omsorgstjenesten. Personvernfremmende teknologier kan hjelpe til med å samle, behandle, analysere og dele data mens datasikkerhet og personvern ivaretas, sier seniorrådgiver Alexandra Makhlysheva i avdeling for helsedata og analyse ved Nasjonalt senter for e-helseforskning. Hun er en av forfattere av rapporten.

Føderert læring: samarbeid uten risiko for datalekkasje

Føderert læring er en type maskinlæring som lar oss analysere dataene der de allerede er lagret og samtidig hindrer at de blir sett av eller delt med andre. Fordelene med denne teknologien inkluderer bedre kontroll over egne data, økt personvern og muligheten til å analysere større og mer representative datasett. Dette kan hjelpe til med å ta bedre beslutninger om behandling og gi bedre helsehjelp til pasienter, uavhengig av behandlingssted eller sykdom.

Å bruke føderert læring gjør det også enklere å oppfylle kravene til hvordan data må behandles slik at personvernprinsippene etterleves. Men det er noen utfordringer knyttet til bruk av teknologien, blant annet ulikheter i dataformater og IKT-infrastrukturer i organisasjonene som skal samarbeide om dataanalyse, økt press på kommunikasjonssystemer og mulige datasikkerhetsrisikoer.

- Det er utfordringer med å trygge dataene i alle systemer. Derfor er det viktig å ha et sikkert kommunikasjonssystem. Det finnes også flere mekanismer som kan brukes for å styrke datasikkerheten og personvernet i fødererte systemer, kommenterer Makhlysheva.

Syntetiske data: realistiske, men anonyme alternativer

Syntetiske data er kunstig genererte data som produseres ved å trene en generativ maskinlæringsmodell med reelle data. De beholder de statistiske egenskapene til det originale datasettet, men inneholder ikke informasjon om faktiske pasienter. Dette er nyttig når vi ikke har nok ekte treningsdata. Det gir oss større og mer representative datagrunnlag, samtidig som det reduserer risikoen for at noen kan finne ut hvem personene bak dataene er. I kombinasjon med andre personvernfremmende metoder kan syntetiske data redusere risiko for personvernbrudd.

Syntetiske data kan brukes i helse- og omsorgstjenesten i utvikling av maskinlæringsmodeller. Senere kan vi sjekke hvordan disse fungerer opp mot reelle data. Det er også nyttig å dele slike data åpent slik at flere kan bruke dem til forskning. Men å bruke syntetiske data kommer med utfordringer. Blant annet evaluering av mulige nye skjevheter og statistisk likhet med originale data samt vurdering av kostnadseffektivitet.

- Hvor nyttig det er å bruke syntetiske data i helse- og omsorgstjenesten vil være forskjellig i ulike situasjoner. Vi må teste dem grundig for å være sikre på at de passer til det vi trenger, samtidig som risikoen for brudd av personvernet er lav, sier Makhlysheva.

Veien videre: forskning, utvikling og praktisk erfaring

Føderert læring og syntetiske data er gode verktøy for å beskytte personvernet når vi analyserer helsedata. For at disse teknologiene skal kunne brukes i klinisk praksis, trenger vi mer forskning, forbedring av verktøy og metoder, samt å teste dem ut i praksis. Da kan de virkelig oppnå sitt fulle potensial og hjelpe oss med å bruke KI på en trygg og nyttig måte i helsetjenesten.

- Teknologiene skal kunne gjøre helse- og omsorgstjenesten bedre for alle – både enkeltpersoner, tjenesten og samfunnet generelt – men de må hele tiden utvikles videre. Da kan vi skape en fremtid der trygg teknologi og omsorg går hånd i hånd, avslutter Makhlysheva.

Referanse:
Makhlysheva A., Bakkevoll P.A., Yigzaw K.Y.
Personvernfremmende teknologier for bruk av kunstig intelligens i helse- og omsorgstjenesten
NSE-rapport 2023-04 – ISBN 978-82-8242-109-6