Logo KIN

BIGMED NLP


BIGMED NLP ved Ahus - Bruk av framtidens metoder for analyse av journaltekst

Hovedmålet med prosjektet er å produsere vektorrepresentasjoner av ord, ofte kalt «embeddinger». Ved å analysere statistiske mønstre i rekkefølgen på ord kan disse algoritmene plassere ord med beslektet betydning i nærheten av hverandre i et abstrakt vektorrom, som typisk har noen 100 dimensjoner. En vektorrepresentasjon fungerer som en abstrakt ordbok for datamaskiner, hvor betydningen av hvert ord er representert som en liste med tall. Ordvektorene kan trenes opp uten noen «fasit» som sier hva ordene betyr, men algoritmene er avhengige av store mengder tekst. Dette prosjektet bruker den samlede kliniske journalteksten i datasystemene til Ahus, hvor pasientenes navn, adresser og personnummer ikke tas med i datagrunnlaget.

Ordvektorene kan benyttes til å søke i journaltekst etter ord som er beslektet med et nøkkelord, og kan gi bedre resultater enn synonymordlister. Den viktigste bruken er likevel at ordvektorene gir en representasjon av ordenes betydning i form av tall, som gjør at de kan benyttes i dyp maskinlæring med kunstige nevrale nettverk. Slike modeller kan f eks trenes opp til å oppsummere innholdet i en pasients journalnotater. Denne teknologien har revolusjonert analyse av tekst på Internett, og vurderes å ha stort potensial i helsesektoren.

Mer informasjon
Gå til bigmed.no for podcastepisode, opptak fra seminar om NLP i helse med mer!

Finansiering
En kombinasjon av NFR-midler gjennom BigMed-satsningen og interne midler.

Resultater
Forskningsresultatene forventes senere i prosjektperioden.

Samarbeidspartnere

Arbeidet ledes av Petter Hurlen (Ahus) i samarbeid med professor Lilja Øvrelid (UiO), førsteamanuensis Øystein Nytrø (NTNU) og Dr Med Pål Brekke (OUS).

Formål

I journalsystemene til Ahus lagres store mengder fritekst, som i liten grad utnyttes. Formålet med dette prosjektet er å etablere, og videreutvikle, moderne teknologi for automatisk tekstanalyse (Natural Language Processing; NLP). Senere kan disse teknikkene gjøre det mulig å utnytte journalteksten bedre til pasientbehandling, kvalitetssikring og forskning.

Ekstern lenke til prosjektet

https://bigmed.no/


Pågående prosjekt

Prosjektperiode

2019 - 2022

Kategorier

Fokusområde:

Annet

Type helsetjeneste:

Spesialist

Type data:

Fritekst

Datakilde:

Syntetiske data, Journal

Planlagt sluttfase:

Testing og validering

Oppgave:

Behandlingsvalg, Tilrettelegging, Annet

Prosjekteier

OUS

Helseregion

Helse Sør-Øst

Kontaktperson