Tre situasjoner
Figur 1 er grafiske beskrivelser av årsak og virkning hektet sammen. Det statistikere kaller en DAG (Directed Acyclic Graph). Et tankekart for statistisk analyse.
I situasjon 1a kalles den tredje variabelen en collider. Her påvirker den ikke sammenhengen mellom den uavhengige og den avhengige variabelen, og skal ikke tas med i den statistiske analysen. Dersom man vil undersøke om diabetes påvirker risikoen for hjertesykdom, og tar med sykehusopphold i analysen – som er en virkning av begge faktorene, ikke en årsak – vil det gi et feilaktig bilde av sammenhengen mellom diabetes og hjertesykdom. Collidere er skumle fordi man ubevisst kan ha tatt dem med i analysen, for eksempel ved å kun samle inn data fra personer innlagt på sykehus. Da har man i praksis feilaktig justert analysen for en collider. Dette er en bekymring i mange covid-19-studier (1).
Situasjon 1b kalles konfundering. En konfunderende variabel påvirker den avhengige variabelen, og er samtidig assosiert med, men ikke påvirket av, den uavhengige variabelen. Dette må vi justere for. Dersom man vil studere sammenhengen mellom trening og lungekreft vil røyking være en konfunderende variabel (2). Denne tredje variabelen – røyking – påvirker risikoen for lungekreft, samtidig som røyking er assosiert med trening (de som røyker mye trener gjerne lite). Uten å justere for røykestatus kan man trekke gale konklusjoner (2).
Situasjon 1c kalles ofte mediering. Hva som er rett å gjøre avhenger av formålet med analysen: Er vi er på jakt etter direkte, indirekte eller total effekt? Om vi vil studere effekten av røyking på risiko for hjerte- og karsykdommer, vil høyt blodtrykk være av interesse. Med blodtrykk som del av analysen finner vi hvor mye røyking påvirker hjerte- og karsykdommer direkte, og hvor mye røyking påvirker hjerte- og karsykdommer indirekte via forhøyet blodtrykk. Dersom blodtrykk ikke tas med i analysen, får vi estimert den totale effekten av røyking. Ofte vil man gjøre begge analysene for å få det fulle bildet. «Low birth weigth paradox» – at røyking har en beskyttende effekt for dødelighet hos små nyfødte – er et klassisk eksempel på hvor galt det kan gå om man ikke tar høyde for mediering (3).