Sammenlikninger mellom grupper
Sammenlikninger mellom grupper er kanskje den vanligste problemstillingen i medisinsk forskning. En slik problemstilling oppstår f.eks. når resultater for en behandlingsgruppe settes opp mot resultatene for en kontrollgruppe.
Hvilken metode som brukes for å teste om det er forskjell mellom ulike grupper, avhenger av type data, antall grupper som skal sammenliknes og om gruppene er avhengige eller uavhengige. I tillegg vil antallet observasjoner og fordelingsegenskapene ha betydning for om man skal velge ikke-parametriske eller parametriske metoder. I tabell 1 gis det en oversikt over aktuelle tester for ulike problemstillinger, basert på Lang & Secic (1). Felles for alle metodene er en nullhypotese om at det ikke er noen forskjell mellom gruppene. Denne hypotesen skal testes mot en alternativ hypotese om at minst to av gruppene er forskjellige.
Tabell
Tabell 1 En oversikt over ulike tester for avhengige og uavhengige utvalg. Fra Lang & Secic (1) |
Antall grupper |
Uavhengige utvalg |
Avhengige utvalg (repeterte målinger) |
Nominale data |
|
|
2 eller flere |
Khikvadrattest |
McNemars test |
|
|
|
Ordinale data |
|
|
2 |
Mann-Whitneys U-test/khikvadrattest |
Wilcoxons fortegnstest |
|
|
|
3 eller flere |
Loglineær modell/Kruskall-Wallis |
ANOVA/Friedman |
|
|
|
Kontinuerlige data |
|
|
2 |
T-test/Mann-Whitneys U-test |
Paret t-test/Wilcoxons fortegnstest |
3 eller flere |
ANOVA/Kruskall-Wallis |
Repeterte målinger/Friedman |
Resultater fra disse testene skal rapporteres som anslag på effektmål, effektmålenes usikkerhet og p-verdier fra hypotesetestene. Eksempelvis kan en studie av endring av blodtrykk rapporteres slik: Medikamentet reduserte diastolisk blodtrykk med i gjennomsnitt 4,3 mm Hg, fra 98,7 mm Hg til 94,4 mm Hg (95 % KI: 2,3 – 6,3, p = 0,017). For de ikke-parametriske testene skal medianverdier eller median differanse rapporteres sammen med ett av tre mål på usikkerhet. Disse er: ekstremverdier, kvartilverdier eller 95 % konfidensintervaller til medianverdien. Velges det siste, brukes avanserte metoder for anslå grensene i konfidensintervallet (5). I tillegg rapporteres p-verdien fra den aktuelle hypotesen. For tester der det ikke er naturlig å rapportere et effektmål, som fra en khikvadrattest, er det ofte tilstrekkelig å rapportere p-verdiene. For mer omfattende tabellanalyser skal teststørrelsen (ramme 1), antall frihetsgrader og p-verdier rapporteres for hver modell som tilpasses.
Resultater fra ANOVA-modeller og modeller for repeterte målinger skal skrives i en resultattabell. Disse modellene viser forskjeller mellom kategoriene til en variabel, der én kategori velges som referansekategori. Også her skal effektmål (differanser), usikkerhet (differansenes konfidensintervaller) og p-verdier rapporteres. I tabell 2 lar vi de ulike kolonnene representere navn på variablene, navn på de ulike kategoriene, anslag på effektmålet, konfidensintervall og p-verdi. For hver variabel begynner man først med en rad for variabelen. På denne linjen skal også p-verdien som er knyttet til en test om at minst to av kategoriene er ulike rapporteres. Deretter følger en linje for hver kategori til variabelen og resultatene for de ulike kategoriene. For p-verdiene som er knyttet til kategoriene, må det oppgis om disse er korrigert for simultane tester.
Tabell
Tabell 2 Eksempel på resultattabell fra en ANOVA-modell. Modellen består av de to variablene «pasientgruppe» og «kjønn». Pasientgruppe deles inn i funksjonsfriske (referanse), pasient-gruppe 1 og pasientgruppe 2 |
Variabel |
Kategori |
Differanse |
95 % KI |
P-verdi |
Gruppe |
|
|
|
0,025 |
Friske (referanse) |
0 |
|
|
Pasientgruppe 1 |
7,45 |
1,56 – 13,3 |
0,016 |
Pasientgruppe 2 |
2,45 |
–2,44 – 7,34 |
0,218 |
Kjønn |
|
|
|
0,114 |
Kvinne (referanse) |
0 |
|
|
Mann |
–1,45 |
–6,34 – 3,44 |
0,114 |
Overlevelsestider presenteres ofte for to grupper. For å teste om det er forskjellig overlevelsestid i gruppene, utføres en logranktest. Det er nok bare å rapportere p-verdien fra denne testen.