Individ- og gruppenivå i befolknings-undersøkelser og helsetjenesteforskning

Øyvind Næss Om forfatteren

Artikkelen presenterer en gjennomgang og en drøfting av den prinsipielle betydningen individ- og gruppenivå har i befolkningsbaserte studier og helsetjenesteforskning. Ulike studiedesign blir omtalt og ulike logiske feilslutninger ved fortolkning av slike studier blir gjennomgått. Artikkelen viser ulike variabeltyper og gjennomgår mulige mekanismer for hvordan gruppenivåfaktorer kan ha effekt for individers helse. På bakgrunn av denne gjennomgangen diskuteres det hvilke implikasjoner dette har for fortolkningen av nåværende og fremtidige studier.

Studier på individ- og gruppenivå kan ha svært forskjellige resultater og betydning i befolkningsbaserte studier og i helsetjenesteforskning. Illustrasjonsfoto

Studier med variabler på gruppenivå, såkalte økologiske variabler, anses ofte som annenrangs i forhold til studier hvor informasjon om variablene er samlet inn for hvert individ. Ofte brukes Durkheims studie av selvmord som eksempel på hvor galt det kan gå (1). Han hadde ikke individdata, men så på selvmordsratene og andel katolikker og protestanter i ulike regioner av Frankrike og fant høyere selvmordsrater der hvor protestantene var i flertall. En epidemiologisk innvending er at Durkheim ikke visste om det var katolikkene i områder med protestanter som faktisk var dem som begikk selvmord (2).

De første epidemiologiske studier la vekt på tre sentrale faktorer for å lete etter epidemiers årsak: tid, sted og person (3). Disse faktorene var nødvendige for å forstå epidemier forårsaket av smittsomme sykdommer. De kunne variere mye over tid, mellom steder og personer. Denne variasjonen i tre dimensjoner hjalp epidemiologen til å finne epidemiens kilde. John Snows arbeid under koleraepidemien i London i 1855 er et eksempel på dette.

Etter den annen verdenskrig har de kroniske sykdommene vært dominerende i vestlige land. Studier av deres årsaker har i stor grad dreid seg om individuell livsstil, altså bare det ene av disse perspektivene. Imidlertid har det vist seg at mye av verdens sykdomsbyrde eller sykdomsvariasjon mellom befolkninger ikke alene lar seg forklare av disse risikofaktorene om livsstilsfaktorer på individnivå. I en WHO-oversikt over den globale sykdomsbyrde for ulike sykdommer ble bare halvparten tilskrevet kjente risikofaktorer (4). I nyere tid har mange etterlyst studier som forsøker å fange viktige sykdomsfaktorer utenfor individet selv (5). Slike økologiske faktorer eller gruppenivåfaktorer anses av noen å spille en stor rolle for forekomsten av viktige folkesykdommer. Dette gjelder både studier rettet mot sykdomsårsaker og effekten av helsetjenester.

Typer feilslutning

Ulike typer feilslutninger er blitt foreslått (6). Den økologiske feilslutning er kanskje mest kjent fordi vi har vært mest opptatt av sykdomsårsaker på individnivå. En påvist assosiasjon på gruppenivå har lav status i kunnskapshierarkiet fordi vi ikke vet om de individene som ble syke, faktisk også ble utsatt for eksponering. Mindre påaktet er den omvendte atomistiske feilslutningen. Vi begår en slik feilslutning når vi identifiserer en faktor på individnivå som egentlig bør forstås overindividuelt (7). Dette gjelder for eksempel mange fysiske og sosiale miljøfaktorer. Betydningen av samme individuelle hygienestandard er for eksempel dramatisk forskjellig avhengig av hvor man befinner seg når det gjelder risiko for gastroenteritt. En annen feilslutning begår vi når vi utelater viktige overindividuelle faktorer og tilskriver sykdomsårsakene psykologiske faktorer. Innvandrere kan for eksempel ha stor relativ risiko for depresjon, og dette kan skyldes at de er i minoritet (overindividuell faktor) og ikke individuelle egenskaper som hudfarge, rase eller bakgrunnsland. Tilsvarende feil kan oppstå hvis sykdommer tilskrives sosiale faktorer når viktige individuelle faktorer utelates. Eksempelvis kan et stressende arbeidsmiljø antas å gi høyt blodtrykk og økt relativ risiko for hjerte- og karsykdommer. Kanskje kan effekten av et stressende arbeidsmiljø forklares av individenes røykevaner.

Individ- og gruppevariabler

Ekte individvariabler gir ikke mening på gruppenivå, som fingeravtrykk eller øyefarge. Andre individbaserte variabler kan gi mening på gruppenivå. Disse variablene kalles da avledede (8). Individers alder ved død, blodtrykk og serum-kolesterolnivå kan godt aggregeres til gruppenivå og fortelle oss om ulik gruppefordeling i for eksempel Finland og Japan. En variant av deriverte variabler er smitte. Infeksjonsstatus betyr mye for den enkelte pasient. Men på gruppenivå betyr andel smittebærere noe annet for risikoen for å bli smittet. Det er stor forskjell på å ha ubeskyttet sex i en befolkning hvor alle har det, og i en befolkning hvor få har det, for ens risiko for å bli smittet med for eksempel HIV. For andre variabler er det mest effektivt å bruke informasjon hentet inn på gruppenivå, selv om det ikke er ideelt, slik som soleksponering. Disse kalles integrerte eller globale variabler og er uten individanalog. Eksempel her kan være størrelsen på et sykehus, administrative retningslinjer eller politiske vedtak. Det kan også være antall sykkelstier eller antall hjelpemidler for fysisk bevegelseshemmede i nærmiljøet.

Hvordan virker makrofaktorene?

Til sjuende og sist er det individenes helse vi som regel er opptatt av. Det er individer som blir syke og dør. Derfor er det kanskje lettere å akseptere en årsaksmodell som tar utgangspunkt i individet som enhet. Et av Austin Bradford Hills kriterier for årsaksslutning i epidemiologi var biologisk plausibilitet (9). Sammenhengen mellom røyking og hjerteinfarkt er biologisk plausibel når vi tenker oss at det er røykerens kropp som er bindeleddet mellom røykingen som eksponering og hjerteinfarkt som utfall. Imidlertid er det vanskelig å forklare hvorfor Japan med høy røykeandel også har lav insidens av hjerteinfarkt. Noe av dette kan skyldes lavere kolesterolnivå, men mye kan også skyldes uidentifiserte risiko- og beskyttelsesfaktorer (4). Ved å sammenlikne hele befolkninger oppnås to ting: For det første fanges viktige individnivåfaktorer som varierer mellom befolkninger, men som ikke varierer nok innad i en befolkning til å la seg identifisere. For det andre kan det tenkes at gruppenivåfaktorer enten direkte eller indirekte forårsaker sykdom. Å identifisere slike faktorer er å bevege seg fra nære til fjerne faktorer i årsakskjeden. Det kan også bety at vi må utvide vårt krav til plausibilitet og kreve en modell som er meningsfull både på individnivå og på gruppenivå.

Gruppenivåfaktor kan endre sammenhengen mellom en individnivåfaktor og et utfall. Ubeskyttet sex som individuell risikofaktor for HIV-smitte varierer mye mellom befolkninger. Den individuelle effekten av å ha ubeskyttet sex er sterkt påvirket av HIV-prevalensen i en befolkning (10). Direkte gruppenivåeffekter kan være vanskelig å forestille seg hvis man insisterer på at hele årsakskjeden skal være klar helt ut til det biologiske utfallet inntrer. Noen har ment at den dramatiske endringen av levealder i Øst-Europa skyldtes direkte effekt av samfunnsendringer fordi endringen ikke tilstrekkelig kunne forklares av identifiserte risikofaktorer på individnivå (11). Eksempel på mer indirekte effekter er når tobakksforebyggende tiltak påvirker individuell røykeatferd, som i sin tur påvirker helsen.

Et grunnleggende problem ved slike gruppenivåstudier er likevel at vi aldri vet like sikkert om effekten kan generaliseres til andre populasjoner. Randomiserte kliniske studier har som oftest individet som enhet, og man kan anta at den biologiske effekten kan gjelde generelt. Sammenhengen mellom røyking og lungekreft kan uproblematisk generaliseres fordi modellen som brukes, er en universell biologisk organisme. Mange hevder at epidemiologiske studier på individnivå i stor grad har manglet dette og bare grepet den biologiske kunnskapen som passet med påviste sammenhenger i en gitt studie. Men i vurdering av effekter påvist på gruppenivå kreves en teoretisk modell utover den biologiske. Hvis vi påstår at effekten av størrelsen på et sykehus har betydning for behandlingsresultater, for eksempel i Norge, må vi kunne forklare hvorfor det samme kanskje ikke er tilfellet i Nepal.

Ulike forskningsdesign

I senere år er publikasjoner med blandet design, som flernivåanalyser eller kontekstuelle analyser, blitt vanlige (12). I disse studiene er det uavhengige variabler både på gruppe- og individnivå. De tar hensyn til begge nivåene i samme analyse. I en klinisk multisenterstudie kan for eksempel pasienter fra et lokalsykehus bli analysert side om side med pasienter fra et stort universitetssykehus. Dersom størrelsen på sykehuset, en gruppenivåvariabel, var av betydning for behandlingsutfallet, vil effektstørrelsen bli feil. For eksempel kan man tenke seg at overlevelsen etter brystbevarende kirurgi ved brystkreft påvirkes av hvor mange operasjoner som utføres på et bestemt sykehus. Videre kan det være vanskelig å påvise forskjeller mellom sykehusavdelinger fordi ulike avdelinger behandler pasienter med ulik prognose. Flernivåanalyser kan i prinsippet korrigere for dette. Slike analyser kan også brukes i befolkningsstudier til å beregne den rene gruppenivåeffekten som gjenstår etter at man har korrigert for individnivåeffekten. Disse modellene ble opprinnelig først utviklet i engelsk pedagogikk hvor spørsmålet var om flinke elever lærte mer av å være i en skole hvor de andre elevene var flinke (13).

Vurdering av kunnskap

Kunnskapsbasert medisin rangerer studier etter gitte kriterier hvor randomiserte forsøk ligger høyest (14). Kan dette prinsippet anvendes på samme måte for studier på gruppenivå? Ofte etterlyses kunnskapsbasert informasjon som verktøy for å utarbeide forebyggende helsetiltak eller helsetjenester (15). Mange faktorer av betydning for slike tiltak ligger på gruppenivå. Sosiale og fysiske miljøfaktorer eller tilgang på helsetjenester er eksempler på dette. Kunnskapsbasert medisin er hovedsakelig opptatt av individbaserte studier. Schwartz & Carpenter kaller det en type III-feil å etterlyse slik kunnskap der det er mer relevant å lete etter årsaker på gruppenivå (16). For slike spørsmål vil antakelig observasjonsstudier på gruppenivå fortsatt være sentralt viktig inntak til verdifull informasjon. Randomisering kan også skje på gruppenivå, men det er uklart i hvilken grad kunnskapen om effekter kan generaliseres til andre befolkninger.

Tok Durkheim feil?

Samfunnsvitere regner Durkheim som en klassiker fordi han gjennom sine arbeider løftet frem sosiale faktorer som noe mer enn summen av individenes handlinger og kalte dem sosiale fakta. Som samfunnsviter var han opptatt av samfunnsbetingelser for menneskers handlinger og brukte selvmord som eksempel fordi det ligger en handling bak. Men i epidemiologiske studier kan perspektivet være noe annerledes fordi utgangspunktet er å avdekke genetiske og miljøbetingede årsaker til sykdommer. Med det vi i dag vet om biologiske og mulig fremtidig identifiserte genetiske faktorer assosiert med depresjon, er det så sannsynlig at han begikk en såkalt sosiologistisk feilslutning? (17) Svaret avhenger av hvilket perspektiv for årsak man velger. Dersom målet er å beskrive sykdomsmekanismen og risikoen i størst mulig detalj slik den fortoner seg for et tenkt individ, vil antakelig nyere biologisk kunnskap være vel så relevant som det å være katolikk. Men selvmordsrater varierer mye mellom befolkninger. Og hvis målet er å beskrive viktige årsaker til at en hel befolkning utsettes for risiko, må også de faktorene på gruppenivå identifiseres som er grunnen til en slik utbredelse. Årsakene til at individer blir syke er ikke nødvendigvis de samme som årsakene til at befolkninger blir syke (18).

Oppgitte interessekonflikter: Ingen

1

Durkheim E. Selvmordet. Oslo: Gyldendal, 1997.

2

Piantadose S, Byar DP, Green SB. The ecological fallacy. Am J Epidemiol 1998; 127: 893 – 904.

3

Susser M, Susser E. Choosing a future for epidemiology: II. From black box to Chinese boxes and eco-epidemiology. Am J Public Health 1996; 86: 674 – 7.

4

Pearce N. Epidemiology as a population science. Int J Epidemiol 1999; 28: 1015 – 8.

5

Murray C, Lopez A. The global burden of disease. Genève: WHO, 1996.

6

Diez-Roux AV. Bringing context back into epidemiology: variables and fallacies in multilevel analysis. Am J Public Health 1998; 88: 216 – 22.

7

Schwartz S. The fallacy of the ecological fallacy: the potential misuse of a concept and the consequences. Am J Public Health 1994; 84: 819 – 24.

8

Bhopal R. Concepts of epidemiology. Oxford: Oxford University Press, 2002.

9

Hill AB, Hill ID. Bradford Hill’s principles of medical statistics. London: Edward Arnold, 1991.

10

Koopman JS, Longini IM jr. The ecological effects of individual exposures and nonlinear disease dynamics in population. Am J Public Health 1994; 84: 836 – 42.

11

Bobak M, Marmot M. East-West mortality divide and its potential explanations: proposed research agenda. BMJ 1996; 312: 421 – 5. 

12

Diez-Roux AV. Multilevel analysis in public health research. Annu Rev Public Health 2000; 21: 171 – 92.

13

Kreft I, de Leeuw J. Introducing multilevel modelling. London: Sage, 1998.

14

Sackett DL, Starus S, Richardson WS. Evidence-based medicine. How to practice and teach EBM. San Diego: Harcourt-Brace, 2000.

15

Davey SG, Ebrahim S, Frankel S. How policy informs the evidence. BMJ 2001; 322: 184 – 5.

16

Schwartz S, Carpenter KM. The right answer to the wrong question: consequences of type III error for public health research. Am J Public Health 1999; 89: 1175 – 80.

17

Sullivan PF, Neale MC, Kendler KS. Genetic epidemiology of major depression: review and meta-analysis. Am J Psychiatry 2000; 157: 1552 – 62.

18

Rose G. Sick individuals and sick populations. Int J Epidemiol 1985; 14: 32 – 8.

Kommentarer

(0)
Denne artikkelen ble publisert for mer enn 12 måneder siden, og vi har derfor stengt for nye kommentarer.

Anbefalte artikler