Hvordan bør rekrutteringen til folkehelseundersøkelsene gjennomføres?

Jens Christoffer Skogen, Marit Knapstad, Otto Robert Smith, Grethe S. Tell, Rolv Terje Lie, Thomas S. Nilsen, Leif Edvard Aarø Om forfatterne

Folkehelseinstituttet fikk høsten 2012 i oppdrag fra Helse- og omsorgsdepartementet å utarbeide maler for en standardisert gjennomføring av fylkesvise folkehelseundersøkelser blant voksne. Malene skulle inneholde et ferdig utviklet spørreskjema og en beskrivelse av forløpet fra planlegging av undersøkelsen til ferdig datafil.

Målet med folkehelseundersøkelsene er å fremskaffe ny informasjon som er nyttig i fylkenes og kommunenes folkehelsearbeid. Tema som skal dekkes, er subjektivt rapportert helse, livskvalitet, helserelatert atferd og lokale forhold som har betydning for folkehelsen.

Data fra folkehelseundersøkelsene vil også brukes som en del av grunnlaget for fylkesvise sykdomsbyrdeanalyser samt som resultater som kan presenteres i Norgeshelsa, Kommunehelsa og kommunehelseprofilene. Planen er videre å stille dataene fra disse undersøkelsene til disposisjon for regionale og lokale forskningsmiljøer.

For å kunne gjøre analyser som best mulig beskriver situasjonen i hele den voksne befolkningen, er det avgjørende å gjennomføre undersøkelsene i representative utvalg. Slike utvalg oppnår en sannsynligvis best ved å trekke et tilfeldig utvalg fra Folkeregisteret. Under planleggingen av Folkehelseundersøkelsen i Hordaland i 2018 ble det i utgangspunktet bestemt at en skulle gjennomføre undersøkelsen ved bruk av helsenorge.no-systemet (det offentlige nettstedet for informasjon om helse og helserelaterte nettjenester). Det viste seg imidlertid at bare omtrent halve befolkningen i Hordaland var brukere av helsenorge.no, noe som var en forutsetning for å kunne bli invitert via denne plattformen. For å undersøke i hvilken grad denne ekstra avgrensingen ville påvirke resultatene systematisk, ble det derfor bestemt at en skulle gjennomføre to datainnsamlinger, den ene ved bruk av helsenorge.no og den andre ved bruk av Folkeregisteret og Tjenester for sensitive data (TSD) ved Universitetet i Oslo. Formålet med denne artikkelen er å belyse i hvilken grad den ekstra seleksjonen en får ved å benytte helsenorge.no-systemet fører til redusert ekstern validitet sammenlignet med folkeregisterutvalget. Vår hypotese var at bruk av helsenorge.no-systemet ville føre til noe økt seleksjon av kvinner og en betydelig negativ helseseleksjon.

Materiale og metode

Undersøkelsen i Hordaland ble planlagt og gjennomført av Folkehelseinstituttet i nært samarbeid med Hordaland fylkeskommune. Et enkelt tilfeldig utvalg av befolkningen i Hordaland fra 18 år og oppover ble trukket fra Folkeregisteret 6. april 2018. Utvalget skulle svare på spørreskjemaet som beskrevet i malen for folkehelseundersøkelser i fylkene utviklet av Folkehelseinstituttet (1). En grundigere presentasjon av instrumenter og metode for undersøkelsene foreligger i en rapport fra Folkehelseinstituttet til Hordaland fylkeskommune (1).

Utvalg

I utgangspunktet ønsket vi å kun gjennomføre spørreundersøkelsen blant brukere av helsenorge.no og benytte helsenorge.no-systemet til datainnsamlingen. Vi trakk først et tilfeldig utvalg fra Folkeregisteret og undersøkte hvem som var brukere av helsenorge.no. Omtrent halvparten av den voksne befolkningen i Hordaland var registrert som brukere av helsenorge.no. For å undersøke mulige skjevheter i resultatene som skyldtes at bare halvparten av den voksne befolkningen var registrert som brukere av helsenorge.no, benyttet vi i tillegg TSD-plattformen for å samle inn data fra et utvalg fra Folkeregisteret. Begge datainnsamlingene ble gjennomført elektronisk, uten postal utsendelse og uten bruk av papirspørreskjema.

Det var en forutsetning at alle som ble inkludert i spørreundersøkelsen hadde digital kontaktinformasjon (mobilnummer og e-post) registrert i kontakt- og reservasjonsregisteret (Direktoratet for forvaltning og IKT, Difi). Andelen som er registrert i dette registeret, er relativt høy for innbyggere i alderen 18–65 år, hvor minst 80 % er registrert (2). Derimot faller andelen registrerte med økende alder, og representativiteten på de inviterte er dermed mer usikker med økende alder. For eksempel er langt under 50 % av befolkningen over 75 år registrert med kontaktinformasjon i registeret (2). Etter en vurdering av størrelsen på de geografiske enhetene (enkeltkommuner, enkeltbydeler i Bergen, minst 400 deltakere per enhet) en ønsket tall for, ble det bestemt at en skulle ha n = 30 000 i helsenorge.no-utvalget og n = 36 000 i folkeregisterutvalget. Totalt ble 68 733 personer trukket ut til å delta, noe som utgjorde omtrent 16 % av den voksne befolkningen i Hordaland på det tidspunktet. Selve datainnsamlingen ble gjennomført i april og mai 2018, med mulighet for to purringer i TSD-systemet og kun mulighet for én purring i helsenorge.no-systemet.

Spørreskjema – utvalgte variabler

Informasjon om kjønn og alder ble hentet fra Det sentrale folkeregisteret. Alder ble brukt som både kontinuerlig og kategorisk variabel (18–29 år, 30–39 år, 40–49 år, 50–59 år, 60–69 år og ≥ 70 år).

Informasjon om høyeste fullførte utdanning var basert på selvrapportering, med følgende fire kategorier: 1) grunnskole/framhaldsskole/folkehøyskole > 10 år (kalt «grunnskole» i tabell 1 og figur 1 og 2), 2) fagutdanning / realskole / videregående skole / gymnas ≥ 3 år («videregående skole»), 3) høyskole/universitet < 4 år («universitet < 4 år») og 4) høyskole/universitet ≥ 4 år («universitet ≥ 4 år»).

Tabell 1

Kjønn, alder og utdanning i to forskjellige utvalg, trukket fra henholdsvis Folkeregisteret og helsenorge.no, i Folkehelseundersøkelsen i Hordaland 2018.

Variabel

Folkeregisteret (%)

Helsenorge.no (%)

P-verdi1

Absolutt differanse2

Relativ forskjell3

Mann

46,4

43,2

< 0,001

3,2

6,8

Alderskategorier (år)

0,594

18–29

16,7

16,5

0,2

1,2

30–39

16,7

16,9

0,2

1,1

40–49

19,2

18,8

0,4

2,1

50–59

20,2

19,7

0,5

2,4

60–69

17,6

18,1

0,5

3,1

≥ 70

9,7

10,0

0,4

3,7

Utdanningsnivå

0,071

Grunnskole

12,6

11,6

0,9

7,5

Videregående skole

35,0

34,9

0,1

0,3

Universitet < 4 år

23,0

23,8

0,8

3,5

Universitet ≥ 4 år

29,5

29,7

0,3

0,9

1Khikvadrattest

2Differanse mellom Folkeregisteret og helsenorge.no oppgitt i absolutte tall

3(Absolutt differanse / Folkeregisteret) ∙ 100

Figur 1 Andel med psykiske vansker i to utvalg, trukket fra henholdsvis Folkeregisteret og helsenorge.no, fra Folkehelseundersøkelsen i Hordaland 2018. Gruppert etter utdanning. Justert for alder og kjønn. Wald-test for interaksjon p < 0,001.

Figur 2 Andel med rapportert god helse i to utvalg, trukket fra henholdsvis Folkeregisteret og helsenorge.no, fra Folkehelseundersøkelsen i Hordaland 2018. Gruppert etter utdanning. Justert for alder og kjønn. Wald-test for interaksjon p = 0,002.

Hopkins Symptom Checklist (HSCL-5) ble benyttet som mål på psykisk helse (3). HSCL-5 består av fem spørsmål om nervøsitet, redsel, håpløshet for fremtiden, nedstemthet og bekymring med følgende fire svaralternativ: «ikke plaget», «litt plaget», «ganske mye plaget» og «veldig mye plaget». Gjennomsnittskår på > 2,00 ble benyttet som grenseverdi for å lage en todelt variabel (3).

Deltakerne ble spurt hvordan de opplevde sin egen helse i alminnelighet, med følgende fem svarkategorier: «svært god», «god», «verken god eller dårlig», «dårlig» og «svært dårlig». I denne artikkelen skiller vi mellom de som rapporterte å ha god eller svært god helse og resten av kategoriene (4), men andre oppdelinger gir tilsvarende resultat som det som blir presentert her (data ikke vist).

Deltakerne ble videre spurt om sin arbeids- eller livssituasjon. En av avkrysningsmulighetene var «uføretrygdet / får arbeidsavklaringspenger». De som krysset av på dette alternativet, er omtalt som personer som mottar uførepensjon.

Ett av spørsmålene var om personen hadde langvarige helseproblemer av minst seks måneders varighet («ja» eller «nei»). Det ble også spurt om personen i løpet av de siste tolv månedene hadde hatt skader som krevde medisinsk behandling («ja, én», «ja, flere» eller «nei»). Deltakerne ble også spurt om sine røyke- og snusvaner. Vi skilte mellom de som rapporterte daglig bruk på svartidspunktet og de som ikke gjorde det.

For å få et globalt mål på subjektiv livskvalitet stilte vi følgende spørsmål: «Alt i alt, når du tenker på hvordan du har det for tiden, er du stort sett fornøyd med tilværelsen eller er du stort sett misfornøyd?» Svaralternativene var «svært fornøyd», «ganske fornøyd», «både-og», «nokså misfornøyd», og «svært misfornøyd». Vi dikotomiserte variabelen mellom de som svarte «ganske fornøyd» eller «svært fornøyd» og de øvrige.

Sosial støtte ble målt med Oslo-3 Social Support Scale (OSS-3), som består av tre spørsmål med fire eller fem svarkategorier. I denne rapporten skiller vi mellom de som opplevde sosial støtte og de som ikke gjorde det, basert på en tidligere benyttet inndeling (5).

Dataanalyse

Dataene ble analysert ved bruk av Stata versjon 15.0. I noen kommuner og bydeler ble det gjennomført oversampling i Folkeregisterutvalget. For disse områdene ble dataene vektet ned tilsvarende. Dataene er analysert ved bruk av krysstabeller, multippel logistisk regresjon og postestimeringer (marginer). For psykiske vansker og generell helse ble undergruppeanalyser presentert på tvers av utdanningsnivå, justert for alder og kjønn. Dette ble gjort etter en testing (Walds test) av interaksjonen mellom utdanningsnivå og innsamlingsplattform med psykiske vansker og generell helse som utfallsmål. Vi valgte å presentere justerte estimat ettersom forskjeller som skyldes alders- og kjønnssammensetning, i denne sammenhengen kan ansees som trivielle. Overordnet var det kun små forskjeller mellom justerte og ujusterte estimat (data ikke gjengitt).

Etiske overveielser

Fylkeshelseundersøkelsen i Hordaland var ved innsamlingstidspunktet hjemlet i konsesjon fra Datatilsynet. I henhold til nye personvernregler er konsesjon nå erstattet av en personvernkonsekvensutredning, og undersøkelsen er nå hjemlet etter § 7 i forskrift om oversikt over folkehelsen (6). Opplysninger fra undersøkelsen vil bli oppbevart i ti år, og all helseforskning hvor opplysninger fra undersøkelsen inngår, vil bli gjennomført etter gjeldende regler for helseforskning og personvern.

Resultater

Andelen av de inviterte som deltok i datainnsamlingen, var 15 954 (41,5 %) i folkeregisterutvalget og 12 332 (40,8 %) i helsenorge.no-utvalget.

Tabell 1 viser prosentfordelinger på kjønn, alder og utdanning etter datasett. De fleste forskjellene var beskjedne. For variablene som har med helse og sykdom å gjøre, var det større forskjeller (tabell 2). Andelen som rapporterte at de har god helse, var 76,0 % i folkeregisterutvalget og 70,6 % i helsenorge.no-utvalget. Videre var andelen i henholdsvis folkeregister- og helsenorge.no-utvalget som rapporterte psykiske vansker 11,6 % mot 13,6 %, uførepensjon 7,8 % mot 10,5 %, langvarig sykdom 9,3 % mot 13,3 %, og skade i løpet av de siste tolv månedene 18,3 % mot 20,8 %.

Tabell 2

Noen helserelaterte variabler i to forskjellige utvalg, trukket fra henholdsvis Folkeregisteret og helsenorge.no, i Folkehelseundersøkelsen i Hordaland 2018.

Variabel

Folkeregisteret (%)

Helsenorge.no (%)

P-verdi1

Absolutt differanse2

Relativ forskjell3

Psykiske vansker

11,6

13,6

< 0,001

2,0

17,2

God helse

76,0

70,6

< 0,001

5,3

7,0

Uførepensjon

7,8

10,5

< 0,001

2,7

34,7

Langvarig sykdom

9,3

13,3

< 0,001

3,9

42,0

Skade siste tolv måneder

18,3

20,8

< 0,001

2,6

14,1

Daglig røyking

8,7

8,4

0,444

0,3

3,0

Daglig snusing

10,4

9,7

0,050

0,7

6,9

Fornøyd med tilværelsen

78,1

75,3

< 0,001

2,8

3,5

Opplever sosial støtte

88,5

87,3

0,002

1,2

1,4

1Khikvadrattest

2Differanse mellom Folkeregisteret og helsenorge.no oppgitt i absolutte tall

3(Absolutt differanse / Folkeregisteret) ∙ 100

Bildet blir ytterligere nyansert når vi analyserer på undergrupper. Figur 3 viser aldersfordelingene i de to utvalgene separat for menn og kvinner. I alle alderskategorier var det litt flere menn enn kvinner som ble invitert i folkeregisterløsningen. I helsenorge.no-løsningen var det flest kvinner som ble invitert med unntak av de eldste alderskategoriene (> 60 år). Den største skjevheten finnes blant de yngste i helsenorge.no-løsningen, der andelen kvinner var nesten halvannen gang høyere enn andelen menn. Denne overrepresentasjonen forsterkes ytterligere av at deltakelsen blant yngre menn var noe lavere i helsenorge.no-løsningen enn i folkeregisterløsningen. Underrepresentasjonen av menn var større i helsenorge.no-utvalget enn i folkeregisterutvalget i alle de tre yngste aldersgruppene.

Figur 3 Alders- og kjønnsfordeling i to utvalg, trukket fra henholdsvis Folkeregisteret og helsenorge.no, fra Folkehelseundersøkelsen i Hordaland 2018. Inviterte og deltakere.

Figur 1 viser andelen som skårte høyt på psykiske vansker, gruppert etter utdanning. Blant de som bare hadde grunnskoleutdanning, var forskjellen mellom utvalgene nokså stor. Analysen av dataene fra helsenorge.no viser en langt sterkere sammenheng mellom utdanningsnivå og psykiske vansker enn det vi finner i dataene fra Folkeregisteret.

Figur 2 viser andelen som rapporterte at de har god helse, gruppert etter utdanning. Andelen som rapporterte at de har god helse, er lavere i helsenorge.no-dataene enn i folkeregisterdataene i alle utdanningsgruppene. Forskjellen er aller størst blant de som bare har grunnskole (omtrent 10 prosentpoeng), men den er også ganske tydelig blant de med videregående skole som høyeste utdanning (7,4 prosentpoeng).

Andre analyser (data ikke vist) viser at andelen som rapporterte at de mottar uførepensjon, er klart høyere i helsenorge.no enn i Folkeregisteret – både blant de som bare har fullført grunnskolen og blant de som bare har fullført videregående skole. Andelen som rapporterte at de lider av alvorlig, langvarig sykdom, er i alle utdanningsgrupper høyere i helsenorge.no enn i Folkeregisteret. Forskjellen mellom helsenorge.no og Folkeregisteret i andelen som rapporterte at de er fornøyd med livet, og som rapporterte at de opplever høy grad av sosial støtte, er størst blant de med kortvarig utdanning.

Diskusjon

Vi fant at forskjellene mellom helsenorge.no- og folkeregisterutvalget var beskjedne med hensyn til fordelingen av utdanningsnivå, alder, andel som røyker daglig, andel som bruker snus daglig, og andel som rapporterer om god sosial støtte. For variabler mer direkte relatert til helse og sykdom var forskjellene større, inkludert andel som rapporterte at de har god helse, mottar uførepensjon, har langvarig sykdom og har vært utsatt for skade i løpet av de siste tolv månedene. For alle disse variablene rapporterte helsenorge.no-utvalget dårligere helse. Analyser av undergrupper viser ytterligere forskjeller. I de tre yngste aldersgruppene (18–49 år) var underrepresentasjonen av menn større i helsenorge.no enn i Folkeregisteret. Blant de som har kortvarig utdanning, var det systematiske forskjeller mellom de to utvalgene med hensyn til andelen som rapporterte at de har psykiske vansker, har god helse, er fornøyde med livet, har høy sosial støtte og mottar uførepensjon. I alle tilfeller var negative utfall mer vanlig i helsenorge.no-utvalget. Ettersom det er grunn til å anta at om lag halvparten av de som deltok i folkeregisterinnsamlingen, også var registrert i helsenorge.no-systemet, er trolig de estimerte forskjellene betydelig mindre enn de ville vært om en hadde sammenlignet med et utvalg som ikke var registrert i helsenorge.no. Det er ofte vanskelig å avgjøre hvilke prosesser som har ført til lav deltakelse (7). Det kan for eksempel godt tenkes at en ikke finner store skjevheter i de innsamlete dataene, men at det er ulike, og motsatt virkende, ikke-deltakelsesprosesser som har ført til dette. Det at andelen dagligrøykere var nokså lik blant deltakerne identifisert via helsenorge.no og Folkeregisteret, kan skyldes to forhold som virker i hver sin retning. Det er grunn til å anta at en høyere andel av de som bruker helsenorge.no, har dårlig helse sammenlignet med de som er rekruttert via Folkeregisteret, noe som kan resultere i en overrepresentasjon av dagligrøykere. Hvis det samtidig er slik at det er flere med høy utdanning som er brukere av helsenorge.no, kan det føre til en underrepresentasjon av dagligrøykere. De to feilkildene kan dermed til dels oppheve hverandre. Det kan tenkes at det er nettopp en slik kombinasjon av feilkilder i seleksjonen som forklarer at andelen dagligrøykere er nokså lik i de to utvalgene. Sammenfallende funn i denne undersøkelsen kan derfor ikke nødvendigvis tolkes som betryggende med hensyn til dataenes gyldighet. Dessuten kan kombinasjoner av feilkilder slå annerledes ut i andre fylker dersom den demografiske sammensetningen eller antall brukere av helsenorge.no er forskjellig fra det vi fant i Hordaland. Det er for eksempel grunn til å tro at forskjellene blir større i et geografisk område hvor færre er registrert i helsenorge.no.

Det foreligger også feilkilder som sannsynligvis er nokså like i de to utvalgene. Det at det foreligger feilkilder som påvirker resultatene i begge datasettene, er ikke et argument for å godta ytterligere seleksjonsfeil ved å begrense utvalget ytterligere til de som er brukere av helsenorge.no. Selv om vi for en del utfallsmål ikke har funnet vesentlige forskjeller, er det forskjeller med hensyn til aldersfordeling, utdanningskategorier og variabler relatert til helse, sykdom og skade. Dette er ikke overraskende når vi vet at helsenorge.no først og fremst er et redskap til kommunikasjon mellom helsevesen og pasienter. Vi må også ta i betraktning at på det tidspunktet undersøkelsen ble gjennomført, var Hordaland det fylket i Norge som hadde den høyeste andelen innbyggere som var brukere av helsenorge.no. Seleksjonsproblemet kan godt tenkes å være enda større eller av en annen art i andre fylker.

Det at andelen som bruker helsenorge.no varierer fra fylke til fylke og fra kommune til kommune innen samme fylke, samt at den øker over tid, betyr at undersøkelser basert på utvalg av brukere fra helsenorge.no ikke er tilstrekkelig sammenlignbare hverken geografisk eller med tanke på å beskrive endringer over tid. Når de fleste i alle alders- og utdanningsgrupper og både kvinner og menn er brukere av helsenorge.no, kan det vise seg at datainnsamlinger som gjennomføres i forbindelse med folkehelseundersøkelsene i fylkene, med fordel kan baseres på helsenorge.no-plattformen. I Hordaland oppnådde vi en like god svarprosent med én enkelt purring i helsenorge.no som vi greide med to purringer i TSD-systemet. Dette kan tyde på at undersøkelser som gjennomføres via helsenorge.no, betraktes som viktigere og mer seriøse enn undersøkelser der en samler inn data på andre måter.

Videre er det sannsynlig at en ville få økt deltakelse i de eldste aldersgruppene ved å supplere den elektroniske datainnsamlingen med papirskjema sendt i posten til de som ikke nås elektronisk. Ulempen er at datainnsamling ved bruk av papirskjema krever et ekstra ledd med manuell innlegging og kvalitetskontroll av data, og at selve datainnsamlingen lett vil ta lengre tid. Vi har ikke gjennomført noen egen studie av hvor store skjevheter som oppstår når en bare benytter elektronisk innsamling av data i de eldste aldersgruppene, eller i hvilken grad en kunne rette opp eventuelle skjevheter ved å supplere med papirspørreskjema.

Konklusjon

Alt i alt finnes det systematiske og ikke-ignorerbare forskjeller mellom de to ulike rekrutteringsløsningene, som vil gi ulike resultater ikke bare når en beskriver hele materialet under ett, men også når en analyserer sammenhenger med demografiske variabler. Basert på våre funn er det sannsynlig at folkeregisterløsningen gir resultater som har høyere ekstern validitet enn resultater fra helsenorge.no-løsningen, og førstnevnte er derfor å foretrekke inntil videre. Fokuset i denne artikkelen var først og fremst å studere mulige forskjeller i viktige utfallsmål mellom de to rekrutteringsplattformene. Men siden svarprosenten i undersøkelsene var såpass beskjeden som litt over 40, kan ikke-deltakelsen – som var felles for begge undersøkelsene – tenkes å ha minst like mye å si for resultatene som forskjellen i resultater mellom de to plattformene. Det blir en viktig oppgave i fortsettelsen å vurdere statistikken som baseres på folkehelseundersøkelsene i fylkene, opp mot statistikk fra andre kilder samt å se på forskjeller mellom de som deltar i undersøkelsene, og de som ikke gjør det, ved å koble mot andre datakilder, blant annet data fra registre.

Hovedfunn

Det var en sterkere underrepresentasjon av yngre menn i utvalget fra helsenorge.no enn i utvalget fra Folkeregisteret.

Våre resultater viste forskjeller i selvrapportert god helse, med lavere andel i utvalget fra helsenorge.no.

Andelen som rapporterte uførepensjon, langvarig sykdom og skade siste tolv måneder, var høyere i utvalget fra helsenorge.no.

Psykiske vansker var høyere representert i utvalget fra helsenorge.no, særlig blant de med kortvarig utdanning.

Artikkelen er fagfellevurdert.

1

Skogen JC, Smith OR, Knapstad M et al. Folkehelseundersøkelsen i Hordaland: Fremgangsmåte og utvalgte resultater. Oslo/Bergen: Folkehelseinstituttet, 2018. https://www.hordaland.no/globalassets/for-hfk/folkehelse/folkehelseundersokinga-hordaland-2018-rapport.pdf Lest 19.8.2019.

2

FOR-2012-06-28-692. Forskrift om oversikt over folkehelsen. https://lovdata.no/dokument/SF/forskrift/2012-06-28-692 Lest 19.8.2019.

7

Rubin D. Inference and missing data. Biometrica 1976; 63: 581–92. [CrossRef]

Kommentarer

(0)

Anbefalte artikler