Dikotomisering av utfall
I klinisk arbeid har en slik dikotomisering gjerne til hensikt å klassifisere et individ som «sykt» eller «friskt», og klassifiseringen kan forenkle avgjørelser om oppfølging eller behandling. Innen klinisk forskning er det også relativt vanlig å kategorisere utfallsvariabler som er målt på en kontinuerlig skala. Et vanlig argument er at en dikotomisering forenkler både statistisk analyse og presentasjon og fortolkning av resultater.
I en studie der effekten av et nytt antidepressivt legemiddel ble studert, var den gjennomsnittlige forskjellen mellom aktiv behandling og placebo 2,3 poeng på skalaen HAM-D (Hamilton depression rating scale) (1). Mange synes at det er enklere å forholde seg til et budskap som sier at 49 % av pasientene som fikk et aktivt legemiddel, responderte på behandlingen, sammenlignet med 34 % av pasientene som fikk placebo, og foretrekker å fokusere på andel respondere.
Det synspunktet kan man ved første øyekast sympatisere med, men forenkling har dessverre en pris. Et viktig problem er tap av informasjon, det vil si at den statistiske styrken blir redusert og at risikoen for at man ikke klarer å avdekke sammenheng mellom for eksempel behandling og utfall øker, selv om det faktisk er en slik sammenheng. Det er for eksempel vist at å dikotomisere en normalfordelt utfallsvariabel reduserer teststyrken like mye som om man hadde forkastet mer enn en tredel av dataene (2).
Et annet problem er at det sjelden er rimelig å anta at det er en underliggende dikotomi. I mange tilfeller er det vanskelig å argumentere godt for valg av en bestemt grenseverdi, men det utvikles likevel ofte mer eller mindre velbegrunnede tradisjoner. I eksemplet over ble en reduksjon i HAM-D-skår på 50 % eller mer definert som respons. Det er nokså opplagt at en slik definisjon i noen grad er vilkårlig – det er neppe noe naturlig skille mellom pasienter som har opplevd like over eller like under 50 % reduksjon i depresjonsskår.
Tap av statistisk styrke som følge av dikotomisering
09.02.2018Eva Skoglund har skrevet nok en god og informativ artikkel i Tidsskriftets statistikkspalte. Skoglund viser at dikotomisering av kontinuerlige variabler kan ha en rekke uheldige konsekvenser, hvor en av de viktigste er tap av statistisk styrke. Dette er en…