Ustrukturerte data fra pasientjournaler kan gi bedre behandling


Mesteparten av helsedata til pasienter er ustrukturert data som legenotater, e-poster og medisinske bilder. Nye analysemetoder vil være et gode for både behandling og helse.

Bruk av ustrukturerte data er ikke fullt ut utforsket og utnyttet, men denne typen data har et enormt potensial. (Illustrasjonsfoto: Colourbox)
Bruk av ustrukturerte data er ikke fullt ut utforsket og utnyttet, men denne typen data har et enormt potensial. (Illustrasjonsfoto: Colourbox)

Elektroniske pasientjournaler er helsepersonells viktigste arbeidsverktøy for rask, enkel og sikker tilgang til nødvendige opplysninger om pasienten uavhengig av hvor pasienten blir syk eller får behandling.

Alle relevante og nødvendige opplysninger om pasienten skal dokumenteres i journalen.

Utfordringer og muligheter ved bruk

Sju forskere ved Nasjonalt senter for e-helseforskning har analysert og sett på utfordringer og muligheter ved bruk av alle dataene i elektroniske pasientjournaler.

De har diskutert temaet grundig og foreslått nye områder for forskning i en kunnskapsoppsummering som er publisert i det vitenskapelige tidsskriftet Wire's Computational Statistics.

De har spesielt sett på hvordan statistikere og andre forskere som for eksempel dataforskere og klinikere kan bidra innen dette viktige feltet.

Strukturerte og ustrukturerte data

Elektroniske pasientjournaler inneholder mye verdifull informasjon om enkeltpasienter og befolkningen.

Helsedata klassifiseres som enten strukturerte eller ustrukturerte.

Strukturerte helsedata er standardiserte og kan lett overføres mellom helseinformasjonssystemer. For eksempel kan pasientens navn, fødselsdato eller et blodprøveresultat registreres i et strukturert dataformat.

Ustrukturerte helsedata er ikke standardiserte og utgjør så mye som 80 prosent av alle helsedata for en pasient.

Dette kan være e-post, lydopptak, legenotater, pasientens symptomer og sykdomstegn, radiologi- og patologirapporter, epikriser, familiehistorie og medisinske bilder/røntgen som leger og annet helsepersonell lagrer i elektronisk pasientjournal.

Tidkrevende å analysere

Ustrukturerte data følger med andre ord ikke noen gitt struktur og har inntil nylig vært utfordrende å analysere. Analyseprosessene er komplekse, tidkrevende og krever ofte uforholdsmessig manuell innsats.

Fremskritt innen datalagringskapasitet, regnekapasitet og maskinlæring gjør det imidlertid stadig lettere å hente informasjon fra og analysere ustrukturerte data. Dermed blir mulighetene til å utnytte disse stadig større.

– Ustrukturerte data kan bidra til bedre behandlinger, sier seniorforsker Maryam Tayefi ved Nasjonalt senter for e-helseforskning. (Foto: Jarl-Stian Olsen / Nasjonalt senter for e-helseforskning)

Tar i bruk nye analysemetoder

Blant ustrukturerte data er klinisk tekst og medisinske bilder de to mest populære og viktige informasjonskildene.

Avanserte statistiske metoder innen naturlig språkanalyse, maskinlæring, dyplæring og konvertering av digitale bilder til data har i økende grad blitt tatt i bruk for å analysere klinisk tekst og bilder.

– Naturlig språkanalyse og maskinlæring brukes i størst grad av forskere, men også klinikere, pasienter og omsorgsleverandører vil ha stor hjelp av teknologien for å nyttiggjøre seg ustrukturerte data fullt ut, sier forsker Maryam Tayefi ved Nasjonalt senter for e-helseforskning.

Bedre data for bedre helse

– Ustrukturerte data kan bidra til bedre behandlinger og gjøre det enklere å ta i bruk systemer for beslutningsstøtte som klinikere, pasienter og helsepersonell kan ha stor nytte av, sier Tayefi.

Hun forteller at større datamengder krever mer tid og ressurser, men dette vil åpne flere muligheter for forskere og eksperter på området for til slutt å forbedre helsen til befolkningen.

Kombinasjonen av store mengder varierte data, datakraft og bedre metoder har gitt store fremskritt også i behandlingen av ustrukturerte helsedata. Det muliggjør rask og automatisert produksjon av maskinlæringsalgoritmer som kan analysere komplekse data med nøyaktige resultater.

Må ivareta pasientenes personvern

Det er fortsatt mange åpne forskningsspørsmål ved bruk av ustrukturerte data som må utredes før denne informasjonen kan brukes effektivt i beslutningsstøtteverktøy for både pasienter og helsepersonell.

Strukturerte og ustrukturerte data er lagret i mange ulike systemer i ulike formater.

I kunnskapsoppsummeringen stiller forskerne blant annet disse spørsmålene:

  • Hvordan kan vi forenkle prosessen med ustrukturert dataanalyse og redusere manuell innsats?
  • Hvordan beskytter vi personvernet samtidig som vi forbedrer kvaliteten og tilgjengeligheten til ustrukturerte data?

– For å svare på dette, må vi se nærmere på ulike metoder for å bevare pasienters personvern. Nye metoder som kan kombinere ustrukturerte og strukturerte data forventes å bli ekstremt viktige i fremtidige innovasjoner. For å forbedre datatilgjengeligheten vil det være avgjørende å ha metoder for å hente ut informasjon fra elektroniske pasientjournaler og selvinnsamlede data, sier Tayefi.

Mulig å utforme nye verktøy

Selv om det eksisterer mange utfordringer som ennå ikke er fullt ut løst, og som kan hindre bruken av ustrukturerte data, er det mulig å utforme nyttige diagnose- og beslutningsstøtteverktøy som inkluderer alle tilgjengelige data.

– Det er gjort flere forsøk på å trekke ut viktig datainformasjon fra elektroniske pasientjournaler ved hjelp av maskinlæring og statistiske metoder. Det er gode muligheter for at slike metoder vil føre til nyttige beslutningsstøtteverktøy og anbefalingssystemer for både pasienter og helsepersonell. I fremtiden vil slike verktøy være en integrert del av behandlingen allmennleger og sykehus tilbyr, mener Tayefi.

Forskning på ustrukturerte data alene er et nytt felt for mange statistikere, så forskere med bakgrunn innen maskinlæring og statistikk, vil bli avgjørende for å få utviklet nye metoder som kan tas i bruk i nær framtid.

– Den underliggende ideen er selvfølgelig å hente ut informasjon fra alle slags ustrukturerte data, men det er fornuftig å starte med hver kilde for seg.

Hun forteller videre at utvikling av systemer som inneholder pålitelig beregning av usikkerhet, er viktig for statistikere. For helseapper og programmer er dette av spesiell interesse, siden brukerne må ha en klar ide om usikkerheten ved en foreslått beslutning.

– For å bevare personvernet til pasienten vil et alternativ være å analysere en gruppe av «like pasienter». En annen metode kan være å bruke syntetiske data som er kunstig opprettet eller skapt av algoritmer, snarere enn faktiske målinger, sier Maryam Tayefi.

Referanse:

Maryam Tayefi mfl.: Challenges and opportunities beyond structured data in analysis of electronic health records. WIREs Comput Stat, 2021. Doi.org/10.1002/wics.1549