Testens validitet
Validiteten dreier seg om hvorvidt testresultat sier noe om det man er ute etter. Sier et mammogram noe om forekomsten av brystkreft? Sier en tuberkulintest noe om en person er infisert med Mycobacterium tuberculosis?
Det som uttrykker validiteten, er sensitiviteten og spesifisiteten. Sensitiviteten uttrykker testens evne til å gi et positivt svar dersom den aktuelle sykdom eller doping er til stede eller har funnet sted. En sensitivitet på 0,9 vil bety at én av ti med sykdommen ikke blir observert/oppdaget. Disse kalles som kjent «falskt negative». Spesifisiteten uttrykker testens evne til å gi negativt svar for dem som ikke har sykdommen eller ikke er dopet. En spesifisitet på 0,9 vil bety at én av ti prøver vil konkludere med at sykdom/doping er til stede for individer som ikke er syke eller dopet. Disse kalles «falskt positive».
Det er av betydning at både sensitivitet og spesifisitet er så nær 100 % som mulig. Men det er viktig å erkjenne at forsøk på å øke sensitiviteten til en test vil redusere spesifisiteten og vice versa. Det finnes ingen a priori-optimalitet i balansen mellom disse. Den optimale balansen er avhengig av sykdommens eller tilstandens art og av det relative forhold av kostnadene av dem. En meget høy sensitivitet er viktig dersom det finnes en effektiv behandling av en alvorlig sykdom. I dopingarbeidet er det spesifisiteten som er viktig – om noen dopede atleter slipper unna er mindre farlig enn det traumet det er for en ikke-dopet å bli dømt. Det er derfor avgjørende for rettssikkerheten å ha en meget høy spesifisitet og at man kan dokumentere dette med statistisk tilfredsstillende empiri. Uten kunnskap om spesifisiteten er det grunnleggende umulig å konkludere om sykdom (in casu doping) er til stede.
Dersom f.eks. 90 % av de syke har en positiv test, kan man da slutte at 90 % av dem med positiv test er syke? Det er ikke sjelden å høre en slik slutning. Men den er feil, og vi demonstrerer sammenhengen i tabell 1. La oss anta følgende verdier: sensitivitet 0,9, spesifisitet 0,9, pretestsannsynlighet (prevalens) 0,01.
Tabell 1
Sammenhengen mellom sensitivitet (0,9), spesifisitet (0,9), prevalens (0,01) og prediksjonskraft i en befolkning på 10 000
|
Test + |
Test – |
Totalt |
Tilstand + |
90 |
10 |
100 |
Tilstand – |
990 |
8 910 |
9 900 |
Totalt |
1 080 |
8 920 |
10 000 |
Prediksjonskraft |
0,083 |
|
|
Med pretestsannsynlighet for sykdom menes en antatt prevalens av sykdommen i den befolkning man tester, en sannsynlighet som er basert på tidligere erfaringer og kunnskap. Med disse tallene vil, i en befolkning på 10 000 personer, 100 være syke. Av de syke er det 90 som har en positiv test. Av de friske er det 990 som har en positiv test. Av de 1 080 som har en positiv test, er det 90 som er syke – dvs. det er bare 8,3 % av dem med positiv test som er syke.
Hva skjer dersom vi antar en pretestsannsynlighet som er lavere, f.eks. 0,005? Tabell 2 viser at da reduseres testens prediksjonskraft fra 8,3 % til 4,3 %.
Tabell 2
Sammenhengen mellom sensitivitet (0,9), spesifisitet (0,9), prevalens (0,005) og prediksjonskraft i en befolkning på 10 000
|
Test + |
Test – |
Totalt |
Tilstand + |
45 |
5 |
50 |
Tilstand – |
995 |
8 955 |
9 950 |
Totalt |
1 040 |
8 960 |
10 000 |
Prediksjonskraft |
0,043 |
|
|
Sannsynligheten for at en positiv test indikerer sykdom, er altså avhengig av prevalensen av sykdommen i den befolkningen man tester. Det betyr f.eks. at sannsynligheten for at en gitt mammogramskygge indikerer brystkreft er forskjellig i en tilfeldig valgt gruppe av kvinner i 50-årsalderen og i en gruppe av kvinner som har en familiær opphopning av brystkreft.