Annonse
Annonse

Dikotomisering av målevariabler – hva er prisen?

Eva Skovlund Om forfatteren

Både i klinisk arbeid og i medisinske forskningsprosjekter anses det ofte som hensiktsmessig å klassifisere målte verdier som normale eller forhøyede. Når man skal utføre statistiske analyser, har dessverre en slik forenkling flere ulemper.

Mange medisinske data er målevariabler, dvs. at de er målt på en kontinuerlig skala, slik som for eksempel blodtrykk, vekt, plasmakonsentrasjon osv. I en del sammenhenger er det hensiktsmessig å dikotomisere ved å skille mellom normalverdier og forhøyede verdier. Da velger man en grenseverdi som klassifiserer pasienter i to grupper, normotensive versus hypertensive eller normalvektige versus overvektige. Et viktig spørsmål er om det går et naturlig eller allment akseptert skille. For mange variabler finnes det ikke noe klart svar på hva som er en rimelig grenseverdi (fig 1).

/sites/default/files/article--2017--11--17-0972--MTA_17-0972-01.jpg

Figur 1 Dikotomisering av en målevariabel. Kan man begrunne godt hvor skillet skal gå?

Dikotomisering av utfall

I klinisk arbeid har en slik dikotomisering gjerne til hensikt å klassifisere et individ som «sykt» eller «friskt», og klassifiseringen kan forenkle avgjørelser om oppfølging eller behandling. Innen klinisk forskning er det også relativt vanlig å kategorisere utfallsvariabler som er målt på en kontinuerlig skala. Et vanlig argument er at en dikotomisering forenkler både statistisk analyse og presentasjon og fortolkning av resultater. 

I en studie der effekten av et nytt antidepressivt legemiddel ble studert, var den gjennomsnittlige forskjellen mellom aktiv behandling og placebo 2,3 poeng på skalaen HAM-D (Hamilton depression rating scale) (1). Mange synes at det er enklere å forholde seg til et budskap som sier at 49 % av pasientene som fikk et aktivt legemiddel, responderte på behandlingen, sammenlignet med 34 % av pasientene som fikk placebo, og foretrekker å fokusere på andel respondere.

Det synspunktet kan man ved første øyekast sympatisere med, men forenkling har dessverre en pris. Et viktig problem er tap av informasjon, det vil si at den statistiske styrken blir redusert og at risikoen for at man ikke klarer å avdekke sammenheng mellom for eksempel behandling og utfall øker, selv om det faktisk er en slik sammenheng. Det er for eksempel vist at å dikotomisere en normalfordelt utfallsvariabel reduserer teststyrken like mye som om man hadde forkastet mer enn en tredel av dataene (2).

Et annet problem er at det sjelden er rimelig å anta at det er en underliggende dikotomi. I mange tilfeller er det vanskelig å argumentere godt for valg av en bestemt grenseverdi, men det utvikles likevel ofte mer eller mindre velbegrunnede tradisjoner. I eksemplet over ble en reduksjon i HAM-D-skår på 50 % eller mer definert som respons. Det er nokså opplagt at en slik definisjon i noen grad er vilkårlig – det er neppe noe naturlig skille mellom pasienter som har opplevd like over eller like under 50 % reduksjon i depresjonsskår.

Dikotomisering av forklaringsvariabler

Også når det gjelder forklaringsvariabler eller kovariater, er et vanlig argument for dikotomisering at det forenkler analyse og presentasjon av resultater. Igjen vil dikotomisering resultere i redusert teststyrke (3). I tillegg vil man miste informasjon om variasjon mellom individer.

«Optimal» grenseverdi

Hvis man, tross ulempene, velger å dikotomisere – hvor skal grenseverdien i så fall ligge? Dersom det ikke eksisterer et tradisjonelt eller naturlig skille, er det relativt vanlig å dele ved medianen. Fordelen er at det blir like mange i hver gruppe. Ulempen er at grenseverdien vil variere mellom studier, og dette vanskeliggjør metaanalyser og direkte sammenligning av resultater. Likevel er en slik fremgangsmåte langt å foretrekke fremfor å prøve seg frem med forskjellige grenseverdier og deretter velge den dikotomiseringen som gir det mest overbevisende resultatet i form av en lav p-verdi. En slik «optimalisering» gir høy risiko for falske positive funn på grunn av multiple signifikanstester og vil overestimere effekt (4, 5). Jeg har inntrykk av at en slik fremgangsmåte ikke er helt uvanlig og at en del publiserte resultater ikke vil være reproduserbare.

Avvik fra linearitet

For både utfallsvariabler og forklaringsvariabler kan et argument for å dikotomisere være at variabelen er ekstremt skjevfordelt og at det ikke er en lineær sammenheng mellom to variabler. Da er det ofte hensiktsmessig å forsøke å transformere variabelen, for eksempel ved en logaritmetransformasjon. Hvis heller ikke transformasjonen resulterer i tilnærmet linearitet, er det en mulighet å kategorisere variabelen. I stedet for å dikotomisere bør man velge inndeling i flere kategorier, minst tre, men gjerne flere hvis man har nok data. Da blir informasjonstapet noe mindre enn om man dikotomiserer. I tillegg får man også et inntrykk av «dose-respons».

Igjen er det viktig å tenke gjennom hva som kan være en rimelig kategorisering før man gjør den statistiske analysen, og man må for all del unngå å velge et bestemt sett av kategorier fordi det gir den laveste p-verdien.

1

Kennedy SH, Emsley R. Placebo-controlled trial of agomelatine in the treatment of major depressive disorder. Eur Neuropsychopharmacol 2006; 16: 93 - 100. [PubMed][CrossRef]

2

Fedorov V, Mannino F, Zhang R. Consequences of dichotomization. Pharm Stat 2009; 8: 50 - 61. [PubMed][CrossRef]

3

MacCallum RC, Zhang S, Preacher KJ et al. On the practice of dichotomization of quantitative variables. Psychol Methods 2002; 7: 19 - 40. [PubMed][CrossRef]

4

Altman DG, Lausen B, Sauerbrei W et al. Dangers of using “optimal” cutpoints in the evaluation of prognostic factors. J Natl Cancer Inst 1994; 86: 829 - 35. [PubMed][CrossRef]

5

Royston P, Altman DG, Sauerbrei W. Dichotomizing continuous predictors in multiple regression: a bad idea. Stat Med 2006; 25: 127 - 41. [PubMed][CrossRef]

Kommentarer

(0)
Annonse
Annonse