Statistisk forklaringsevne
I en randomisert studie med benskjøre eldre kvinner gjennomførte intervensjonsgruppen et treningsopplegg og ble sammenlignet med en kontrollgruppe (1). Et av utfallsmålene ved oppfølging etter tre måneder var antall ganger deltagerne kunne reise seg fra en stol i løpet av 30 sekunder. Treningsgruppen reiste seg i gjennomsnitt 1,6 ganger mer enn kontrollgruppen, med et gjennomsnitt på hhv. 14,6 og 13,0 ganger for de to gruppene (figur 1a). Konfidensintervallene gjenspeiler den statistisk signifikante forskjellen mellom gruppene, og viser at trening hjalp deltagerne «opp av stolen». På individnivå var det likevel stor variasjon, og mange i kontrollgruppen hadde bedre resultat enn deltagere i treningsgruppen (figur 1b). På individnivå virker forskjellen, og dermed treningseffekten, mindre enn på gruppenivå.
Informasjon om den individuelle variasjonen i dataene og hvor mye den statistiske analysen forklarer denne, er viktig. Et vanlig mål er determinasjonskoeffisienten, ofte kalt R2. Vi bruker den typisk ved regresjonsanalyser, og den forteller oss hvor mye av variasjonen i utfallsmålet som er forklart av regresjonsmodellen. Den går fra 0 ved ingen forklaring til 1 ved perfekt eller 100 % forklaring av variasjonen. I eksempelet i figur 1 var R2 = 0,04. Altså er 4 % av variasjonen mellom studiedeltagerne forklart av den gjennomsnittlige forskjellen mellom de to gruppene. Er utfallsmålet binært (f.eks. syk eller frisk) og dataene analysert med logistisk regresjon, finnes varianter av R2 som f.eks. Tjurs R2, McFaddens R2 og Nagelkerkes R2 (2). For en logistisk regresjonsmodell er det også relevant å si hvilken evne modellen har til å skille mellom de to gruppene, f.eks. mellom syke og friske. Et vanlig mål for dette er det såkalte arealet under kurven, der 0,5 betyr ingen evne utover tilfeldigheter, og 1 betyr en perfekt evne.
Det finnes også andre avanserte statistiske mål for hvor godt den statistiske modellen er tilpasset dataene. Akaikes informasjonskriterium (AIC, Akaike information criterion) og bayesiansk informasjonskriterium (BIC, Bayesian information criterion) er to mål som tar hensyn til både tilpasningen av dataene og modellens kompleksitet. Tolkningen og bruken er vanskeligere enn for R2, og disse målene benyttes i hovedsak til å sammenligne forskjellige statistiske modeller basert på det samme datasettet.