Den første norske kliniske språkmodellen utviklet
Norge har nå tatt et betydelig skritt framover innenfor bruk av kunstig intelligens (KI) i helsesektoren. Forskere ved Nasjonalt senter for e-helseforskning har nå klart å utvikle den første norske kliniske språkmodellen, kalt NorDeClin-BERT.
Denne modellen er basert på avansert naturlig språkbehandling (NLP) og er spesialtilpasset for å trekke ut kunnskap fra kliniske tekster. Dette åpner opp for en rekke muligheter innen helseforskning og pasientbehandling. Men først må forskerne anonymisere data fra deg som pasient for å utvikle tjenesten.
Hva er NorDeClin-BERT?
NorDeClin-BERT er en språkmodell basert på BERT-teknologi (Bidirectional Encoder Representations from Transformers), opprinnelig utviklet av Google i 2018.
Denne språkmodellen er trent på norske kliniske tekster, noe som gjør den i stand til å forstå medisinske termer og sammenhenger på en måte som generelle språkmodeller ikke kan. Dette er avgjørende for at modellen skal kunne anvendes i helsesektoren, hvor presis og korrekt forståelse av tekst kan være livsviktig.
Utfordringer og løsninger
En av de største utfordringene ved utviklingen av NorDeClin-BERT har vært tilgangen til kliniske data. Kliniske tekster inneholder sensitive personopplysninger, og det kreves omfattende godkjenninger for å bruke disse dataene til forskning.
ClinCode-gruppen i Nasjonalt senter for e-helseforskning har jobbet i 4-5 år for å få tilgang til nødvendige data og har utviklet metoder for å pseudonymisere dataene slik at personvernet ivaretas.
Betydningen av NorDeClin-BERT for helsesektoren
NorDeClin-BERT har potensial til å revolusjonere hvordan helsepersonell håndterer klinisk informasjon. Modellen kan anvendes til en rekke oppgaver, som automatisk koding av diagnoser (ICD-koder), for eksempel automatisk koding av diagnoser (ICD-koder), identifisering av legemiddelnavn i tekster og til og med pseudonymisering av tekst.
Dette kan føre til raskere og mer nøyaktig behandling av pasientinformasjon, noe som igjen kan forbedre pasientsikkerheten og effektivisere sykehusadministrasjon.
- Klinisk tekst er forskjellig fra vanlig norsk tekst på den måten at leger og helsepersonell kanskje skriver dette på forskjellige måter. De kan bruke forskjellige navn med forskjellige betydninger, så en modell som er i stand til å dekode og forstå språket fra helsepersonell er en viktig innovasjon for å forbedre både pasientbehandling og effektiviteten i helsesektoren, mener Phuong Dinh Ngo.
Konkurranse og samarbeid
Selv om vi nå har vår første kliniske språkmodell innen gastrokirurgi, har andre aktører i Norge som Helse Vest IKT, Helse Bergen, Helse Fonna, Helse Stavanger, Helse Førde og DIPS jobbet med lignende prosjekter.
- Med KI vil helsepersonell kunne bruke tiden sin mer effektivt som kan bidra til mer arbeidsbesparende prosesser. Som eksempelvis mer effektivt og bedre innhold i journaler, støtte legens arbeidsprosess ved å sette sammen informasjon fra for eksempel blodprøver, bildeundersøkelser og journaltekst, hente inn og raskt ta i bruk ny forskningsbasert kunnskap, spørre en digital kollega om råd og for eksempel få forslag til mulige diagnoser, og få hjelp til å vurdere risiko i behandlingen, sier statssekretær Rønning-Arnesen.
NorDeClin-BERT har dratt nytte av samarbeid med sine svenske partnere som har gitt verdifull innsikt og ressurser fra den svenske forskningsinfrastrukturen Health Bank ved Stockholms universitet, og ikke minst samarbeidet med gastrokirurgisk avdeling ved Universitetssykehuset Nord-Norge.
Dette samarbeidet har vært avgjørende for å akselerere utviklingen og sikre at Norge kan være i forkant av denne teknologiske utviklingen.
Veien videre
Forskerne har allerede søkt om godkjenning av språkmodellen for å gjøre den delbar med andre forskere og helseinstitusjoner. Det arbeides med å få på plass finansiering til å gjennomføre en implementeringsstudie ved noen sykehus for å se hvordan dette ser ut i en ekte klinisk behandlingsprosess.
- Prosjektet er planlagt ferdigstilt i 2025, men allerede i andre halvdel av 2024 håper og forventer vi at den første versjonen av NorDeClin-BERT vil være tilgjengelig for bruk i helsesektoren, sier Miguel Angel Tejedor Hernandez.
Målet er at modellen skal bli en ressurs for hele helse-Norge, med mulighet for videreutvikling og tilpasning til flere medisinske fagfelt.
Konsekvens
Utviklingen av NorDeClin-BERT markerer starten på en ny æra for bruk av kunstig intelligens i norsk helsevesen. Med potensial til å forbedre alt fra pasientsikkerhet til sykehusadministrasjon, er denne modellen et eksempel på hvordan avansert teknologi kan bidra til bedre helse for alle. Samtidig setter den Norge på kartet som en pioner innen klinisk AI-forskning.
Hva er klinisk tekst?
Klinisk tekst refererer til skriftlig dokumentasjon som brukes i helsesektoren og inneholder informasjon om pasienters helsetilstand, diagnoser, behandlinger, medisiner og annen relevant medisinsk informasjon. Dette inkluderer blant annet:
Journalnotater: Dokumentasjon skrevet av leger, sykepleiere og annet helsepersonell under pasientens behandling.
Epikriser: Oppsummeringer av pasientens sykehistorie, diagnose og behandling som blir skrevet ved utskrivelse fra sykehuset.
Henvisninger: Skriftlig informasjon som sendes fra en lege til en spesialist eller annen behandlingsinstans.
Diagnoser og ICD-koder: Kategorisering og koding av sykdommer og medisinske tilstander.
Resepter: Skriftlige foreskrivelser av medisiner og behandlingsplaner.
Klinisk tekst er ofte komplekst og teknisk, med spesialiserte medisinske termer og uttrykk som kan variere avhengig av konteksten. Presis og korrekt forståelse av denne teksten er avgjørende for riktig behandling og pleie av pasienter. Det er her kliniske språkmodeller, som NorDeClin-BERT, kan spille en viktig rolle ved å automatisere og forbedre prosessen med å tolke og anvende informasjon fra kliniske tekster.