Type I-feil og type II-feil

Stian Lydersen Om forfatteren
Artikkel

Anta at man vil prøve ut en ny type medisinsk behandling for å finne ut om denne har bedre effekt enn vanlig behandling (treatment as usual). Det er viktig at sannsynligheten for å komme til feil konklusjon er lav. Men det finnes to typer feilslutninger, og de regnes ikke som like viktige.

I utgangspunktet vet vi ikke hva som er sannheten. Det kan hende at de to behandlingene har samme effekt. Dette kalles nullhypotesen (H0). Eller den nye behandlingen kan ha bedre effekt enn vanlig behandling. Dette kalles alternativhypotesen (HA). Merk at dette gjelder for en overlegenhetsstudie (superiority study), slik det er beskrevet her. I en ikke-underlegenhetsstudie (non-inferiority study), derimot, vil nullhypotesen være at den nye behandlingen er dårligere enn vanlig behandling (1).

To typer feil

Dersom sannheten er at behandlingene har samme effekt, og man konkluderer med at man beholder H0, er dette en korrekt konklusjon. Hvis man derimot feilaktig konkluderer med å forkaste H0, gjør man en type I-feil. Dette er illustrert i Figur 1. Da vil man kunne ta i bruk den nye behandlingen, til tross for at den i virkeligheten ikke er bedre enn vanlig behandling.

Figur 1 Vi ønsker i størst mulig grad å unngå en type I-feil, illustrert med rød farge, mens vi vanligvis ikke setter like sterke krav til sannsynligheten for type II-feil (gul farge).

Dersom sannheten er at den nye behandlingen virkelig er bedre enn standard behandling, men ikke påviser dette, gjør man en type II-feil. Da vil man ikke ta i bruk den nye behandlingen, til tross for at den er bedre. Hvis man derimot konkluderer med å forkaste H0, gjør man det riktige.

Hypotesene er ikke likeverdige

Situasjonen er ikke likeverdig eller symmetrisk i H0 og HA. Hvis vi er i tvil, vil vi akseptere nullhypotesen. Det vil si, vi aksepterer at den kan være sann. Vi ønsker i størst mulig grad å unngå en type I-feil, som illustrert ved fargene i Figur 1. Når man planlegger en studie og den tilhørende statistiske analysen, vil man typisk kreve at sannsynligheten for en type I-feil skal være liten. Ofte kreves at sannsynligheten for type I-feil skal være maksimalt 5 %. Denne grensen for sannsynligheten kalles signifikansnivået. Man stiller vanligvis ikke like sterke krav til sannsynligheten for type II-feil. Sannsynligheten for korrekt å forkaste H0 når HA er riktig, kalles statistisk styrke. Det er ganske vanlig å planlegge studier slik at statistisk styrke er minst 80 % eller 90 %. Da vil sannsynligheten for type II-feil bli inntil 20 % eller 10 %. Merk at denne asymmetrien også gjenspeiles i ordvalget: Vi aksepterer H0, eller vi forkaster H0 (og påstår HA).

Straffesaker i rettsvesenet har en asymmetri som er analog til dette: Der vil nullhypotesen være at tiltalte er uskyldig, mens alternativhypotesen er at tiltalte er skyldig. Hvis retten er i tvil, skal tiltalte ikke dømmes. Og hvis man er i tvil ved hypotesetesting, så aksepterer man at nullhypotesen kan være sann.

Alternativt kan man kalle type I-feil og type II-feil for henholdsvis falskt positive og falskt negative funn – se Språkspalten i dette nummeret av Tidsskriftet (2).

Relevant ved planlegging av en studie

Merk at sannsynlighet for type I-feil og sannsynlighet for type II-feil er relevante størrelser ved planlegging av en studie. Etter at studien og analysene er gjennomført, vil relevante mål på usikkerhet i forhold til konklusjonen være konfidensintervall og p-verdi (3).

Anbefalte artikler