Parede kategoriske data

Medisin og tall
    ()

    sporsmal_grey_rgb
    Artikkel

    Hvis man skal sammenlikne andeler i to uavhengige grupper, kan man for eksempel bruke Pearsons khikvadrattest. Men dersom dataene kommer fra matchede par, må man bruke metoder som tar hensyn til avhengighet innen parene.

    Matchede par kan komme fra forskjellige situasjoner og studiedesign. Parene kan være status for en person før og etter en behandling, en randomisert kontrollert studie med kontralateral design der f.eks. venstre og høyre øye randomiseres til henholdsvis øyedråper A og B, en matchet kasus–kontroll-studie, eller et overkrysningsforsøk, som vi skal se på i et eksempel her.

    Som beskrevet tidligere i denne spalten, er et overkrysningsforsøk et randomisert kontrollert forsøk hvor deltakerne får både en behandling A og en behandling B, i randomisert rekkefølge (1). Som eksempel brukte vi et forsøk som sammenliknet effekten av et probiotikum med placebo hos deltakere med irritabel tarm-syndrom (2), og vi omtalte aktuelle analysemetoder for en kontinuerlig utfallsvariabel. Nå skal vi se på en kategorisk utfallsvariabel, nærmere bestemt om deltakeren opplever suksess i form av tilfredsstillende symptomreduksjon.

    Konkordante og diskordante par

    Konkordante og diskordante par

    Her finnes det fire mulige resultater for den enkelte deltaker: Deltakeren opplever suksess med både A og B, med verken A eller B, bare med A eller bare med B. Resultatene for denne studien (2) er vist i tabell 1, der A er placebo, og B er aktiv behandling. Vi ser at elleve deltakere ikke opplevde suksess med noen av behandlingene, mens én deltaker opplevde suksess med begge behandlingene. Disse tolv parede observasjonene kalles konkordante par, fordi de to observasjonene i parene samsvarer. Dersom deltakeren opplevde suksess bare med A eller bare med B, kalles det et diskordant par. I denne studien var det fire diskordante par, hvorav alle fire opplevde suksess med A, og ingen opplevde suksess med B.

    Tabell 1

    Resultater for 16 deltakere, hvorav 4 + 1 = 5 opplevde suksess med behandling A, og 0 + 1 = 1 opplevde suksess med behandling B (2).

     

    Suksess med B
    (aktiv behandling)

     

     Suksess med A (placebo)

    Nei

    Ja

    Totalt

    Nei

    11

    0

    11

    Ja

    4

    1

    5

    Totalt

    15

    1

    16

    Konfidensintervall og p-verdi

    Konfidensintervall og p-verdi

    I dette eksempelet ser vi at andel suksesser med behandling A og B var henholdsvis 5 / 16 = 0,31 og 1 / 16 = 0,06, med en differanse på 0,25 i favør av behandling A, som var placebo. Det vil ofte være relevant å beregne et konfidensintervall for differansen mellom sannsynligheten for suksess med de to behandlingene, for forholdet mellom sannsynlighetene eller for oddsratioen. Det siste vil være aktuelt for en matchet kasus–kontroll-studie. Det finnes ulike metoder for å beregne konfidensintervall og p-verdi for matchede par (3). Flere av metodene tar utgangspunkt i de diskordante parene. Hvis det ikke er forskjell på behandlingene, vil man forvente at halvparten av disse opplever suksess med A, og halvparten omvendt. Jo mer andelen med suksess med A avviker fra halvparten, jo sterkere er evidensen for at behandlingene har forskjellig effekt.

    McNemars test bygger på nettopp dette. Vi har tidligere sammenliknet i alt fem forskjellige versjoner av McNemars test (3) og fant at en av de versjonene som er enklest å beregne, og som kalles McNemars mid-p-test, alltid kan anbefales. Overraskende nok har den bedre egenskaper enn en såkalt eksakt test, også for små utvalg. I den aktuelle studien fås p = 0,0625. Vi studerte også ulike metoder for konfidensintervall (3) og fant at blant annet Newcombes metode for differansen alltid kan anbefales. I dette eksempelet blir et 95%-konfidensintervall for differansen lik −0,494 til 0,015. En oversikt over forskjellige metoder og anbefalinger finnes i (4). Mange av metodene var lite tilgjengelige i statistisk programvare før 2022, men finnes nå i SPSS versjon 28, og i programvarepakken «contingencytables» for R (5).

    Flere enn to kategorier

    Flere enn to kategorier

    I dette eksempelet hadde utfallsvariabelen bare to kategorier, og de parede observasjonene kunne telles opp i en 2×2-tabell, som i tabell 1. Dersom utfallsvariabelen har tre kategorier, vil resultatene kunne vises i en 3×3-tabell, osv. En oversikt over metoder og anbefalinger for parede kategoriske data med flere enn to kategorier finnes i Fagerland og medarbeidere (4). Disse metodene er også implementert i «contingencytables» for R (5).

    PDF
    Skriv ut
    Kommenter artikkel

    Anbefalte artikler

    Laget av Ramsalt med Ramsalt Media