Type I-feil og type II-feil – eller falskt positive og falskt negative funn?

Stian Lydersen Om forfatteren
Artikkel

Forskere må være fortrolig med type I-feil og type II-feil. Det finnes andre ord som får bedre frem hva dette er.

Illustrasjon: Tidsskriftet

Termene type I-feil og type II-feil er forklart i en artikkel i artikkelserien Medisin og tall i dette nummeret av Tidsskriftet (1). Enkelt forklart er type I-feil en feil man gjør dersom man forkaster en sann nullhypotese. Tilsvarende er type II-feil å unnlate å forkaste en usann nullhypotese. Disse termene skal ha vært brukt for første gang av statistikerne Jerzy Neyman og Egon Pearson i 1933 (2). Finnes det andre ord enn type I-feil og type II-feil som får bedre frem hva betydningen er?

I læreboka Statistikk for universiteter og høgskoler står det: «Type I-feil kalles også forkastingsfeil, fordi det betyr at vi feilaktig forkaster nullhypotesen. Type II-feil kalles godtakingsfeil, fordi vi feilaktig ‘godtar’ nullhypotesen» (3). I Store Norske Leksikon står det at type I-feil også er kjent som alfa-feil og type II-feil som beta-feil (4). I enkelte engelske lærebøker i statistikk er disse termene noe brukt som alternativer til type I-feil og type II-feil. Men dette er ikke entydig: Noen bruker beta for sannsynligheten for type II-feil, mens andre bruker beta for statistisk styrke, altså 1 minus sannsynligheten for type II-feil. Jeg har ikke sett termene alfa-feil eller beta-feil brukt i norske lærebøker i statistikk.

I ordlisten til forfatterveiledningen i Tidsskriftet er type I-feil forklart med godtroenhet og type II-feil som overforsiktighet. Disse termene viser asymmetrien mellom type I-feil og type II-feil, men er ikke egnet som synonymer til type I-feil og type II-feil.

I litteraturen innen medisinsk statistikk er type I-feil og type II-feil ofte omtalt som henholdsvis falskt positive funn og falskt negative funn. Tilsvarende kan man bruke uttrykket sant negativt funn når man korrekt beholder nullhypotesen, og sant positivt funn når man korrekt forkaster nullhypotesen. Slike termer brukes også om diagnostiske tester, hvis egenskaper kan uttrykkes ved sensitivitet og spesifisitet (5). Sensitivitet er sannsynligheten for å få et positivt testresultat, altså et sant positivt funn, hvis personen faktisk er syk. Spesifisitet er sannsynligheten for å få et negativt testresultat, altså et sant negativt funn, for en frisk person. Men måten man vektlegger sensitivitet i forhold til spesifisitet er annerledes enn asymmetrien ved hypotesetesting. I mange sammenhenger kan det være ønskelig med høy sensitivitet, selv om det kan medføre mange falskt positive funn. Dette er ikke tilfelle ved statistisk hypotesetesting.

Merk at det heter falskt positive (eller negative) funn, ikke falske positive (eller negative) funn. Falskt er et adverb som står til adjektivet positive (eller negative), og skal ikke bøyes etter substantivet funn (6).

Etter mitt syn er falskt positive funn og falskt negative funn gode uttrykk for å presisere eller utdype hva som menes med type I-feil og type II-feil, og de kan brukes som synonymer. Uttrykkene er intuitivt forståelige, og de er mye brukt i statistisk og medisinsk faglitteratur.

Anbefalte artikler