Hvordan oppsummere ordinale data?

Stian Lydersen Om forfatteren
Artikkel

I mange studier inngår ordinale data, for eksempel heltallene fra 1 til 4. Kan det være meningsfylt å oppsummere slike data ved bruk av gjennomsnitt eller median?

Ordinale skalaer, ofte kalt Likert-skalaer, brukes mye innen medisinsk forskning og en rekke andre fagfelt. Et eksempel er spørsmålet «Hvordan er helsa di nå?» i Helseundersøkelsene i Nord-Trøndelag (HUNT). Svaralternativene er kategoriene «Dårlig», «Ikke helt god», «God» og «Svært god», som vi her vil nummerere fra 1 til 4. Kategoriene er ordinale, fordi selvopplevd helse er bedre jo høyere opp på skalaen man krysser av. Men «avstanden» mellom kategoriene behøver ikke være like stor. Et kvantitativt mål på «avstand» mellom kategoriene behøver ikke engang å være meningsfylt.

Tabell 1 viser svarfordelingen for dette spørsmålet i Ung-HUNT 1 (1), separat for gutter og jenter. Vi ser at jenter rapporterte dårligere helse enn gutter. Denne forskjellen er statistisk høysignifikant: Wilcoxon-Mann-Whitneys test gir p = 0,001. Forskjellen er mest tydelig for kategorien «Svært god», som rapporteres av henholdsvis 32,9 % av guttene og 24,2 % av jentene. En så stor forskjell i prosentandel vil i mange sammenhenger regnes som klinisk relevant.

Tabell 1

Selvrapportert helse for ungdom mellom 12 og 20 år fra Helseundersøkelsen i Nord-Trøndelag i perioden 1995–97.

Antall (%), fra (1)

Antall i eller over denne kategorien (%)

Kategori

Gutter

Jenter

Gutter

Jenter

Differanse i %

Dårlig (= 1)

3 (0,4)

3 (0,4)

Ikke helt god (= 2)

57 (8,5)

77 (9,2)

671 (99,6)

837 (99,6)

−0,09

God (= 3)

392 (58,2)

557 (66,3)

614 (91,1)

760 (90,5)

0,62

Svært god (= 4)

222 (32,9)

203 (24,2)

222 (32,9)

203 (24,2)

8,77

Totalt

674 (100)

840 (100)

9,30

Median av ordinale data

I det aktuelle eksempelet er medianen lik kategori 3 («God») for både gutter og jenter. Hvordan er dette mulig når det er en statistisk høysignifikant forskjell mellom kjønnene? Vi kan fastslå at median er et lite egnet mål på sentraltendens for ordinale data, særlig når det er få kategorier slik som her. Til tross for dette bruker mange forskere median som mål på sentraltendens for ordinale data, antakelig fordi noen hevder at medianen, og ikke gjennomsnittet, er relevant hvis dataene ikke er normalfordelt (2). Men hvordan kan Wilcoxon-Mann-Whitneys test likevel påvise en høysignifikant forskjell? Svaret er at denne testen ikke er begrenset til å teste om medianen er forskjellig, men generelt tester om verdiene i den ene gruppen er høyere enn i den andre. I dette eksemplet er dette tilfelle, selv om medianen er lik.

Gjennomsnitt av ordinale data

Hvis vi regner ut gjennomsnittsskåren for hvert av kjønnene, får vi 3,236 for gutter og 3,143 for jenter, og differansen blir 0,093. Kan dette være et egnet oppsummeringsmål for forskjellene mellom gruppene? Det er ikke intuitivt hvordan det kan tolkes på en ordinal skala, men differanse i gjennomsnittsskår har faktisk en praktisk fortolkning ved en Likert-skala (3): Hvis vi slår sammen kategori 2, 3 og 4 og sammenligner med kategori 1, får vi at andelen med høyere selvopplevd helse er 671 / 674 = 0,9955 for gutter og 837 / 840 = 0,9964 for jenter, med differanse eller sannsynlighetsovervekt på −0,0009 eller −0,09 %. Tilsvarende tall for de andre mulige dikotomiseringene er vist i tabell 1. Summen av sannsynlighetsovervekt for gutter i forhold til jenter er lik 9,3 %, altså 0,093, som er identisk med differansen i gjennomsnittsskår. Med andre ord er det ikke nødvendig at skalaen har lik avstand mellom trinnene for at differansen i gjennomsnittsskår skal kunne ha en fortolkning.

Hva bør rapporteres?

Hvilke oppsummeringsmål er egnet for ordinale data? Man bør alltid rapportere de faktiske antall i hver kategori, som i de to første tallkolonnene i tabell 1. Median (og kvartiler) er ikke egnet for ordinale data, i alle fall ikke ved få kategorier. Gjennomsnitt har en forståelig fortolkning i form av sannsynlighetsovervekt og kan være relevant i noen sammenhenger.

Anbefalte artikler