Brukbar håndbok for evaluering av diagnostiske tester

Artikkel

Å tenke i sannsynligheter i vurderingen av diagnostiske tester slo gjennom på 1980-tallet. Den danske indremedisineren Henrik Wulffs bok Rationel klinik ble en inspirasjonskilde for mange leger som ville forske på diagnostikk. Han brukte 2 ¥ 2-tabellen for å anskueliggjøre og beregne testers nytteverdi. Han viste hvordan sensitivitet, spesifisitet og prevalens hver for seg innvirker på sannsynlighet for sykdom. Denne form for sannsynlighetsberegning hadde tidligere blitt lansert av matematikeren Bayes i form av en ligning (Bayes’ teorem). David Sackett har utviklet denne tankegangen videre, og skrev i 1985, sammen med Haynes og Tugwell, den pedagogiske og velformulerte Clinical epidemiology , som har fått en betydelig utbredelse.

Man har etter hvert høstet en del erfaring med metodene for å analysere diagnostiske testers nytteverdi, som ble presentert i de ovennevnte bøker. Det er nok derfor BMJ Books har funnet det på sin plass å gi ut en bok som kan supplere tidligere lærebøker i klinisk epidemiologi. Boken er en artikkelsamling som er redigert, og i stor grad skrevet av André Knottnerus. Han er tilknyttet avdeling for allmennmedisin ved universitetet i Maastricht i Nederland og har de siste 20 årene vært blant de fremste i Europa når det gjelder forskning på diagnostikk.

Et viktig budskap i boken er at sensitivitet og spesifisitet ikke bare skal sees på som testegenskaper, men også som egenskaper hos pasientene med og uten den sykdommen man ønsker å diagnostisere. Sensitiviteten vil variere med alvorlighetsgraden av sykdommen, spesifisiteten med forekomsten av andre tilstander som også kan gi positivt testresultat. Seleksjon av pasienter, f.eks. til undersøkelse på sykehus, kan føre til opphopning av testpositive både blant pasienter med og uten den aktuelle sykdommen. Svakheter ved gullstandarden vil slå ulikt ut på sensitivitet og spesifisitet avhengig av prevalensen av sykdommen blant pasientene som blir undersøkt. Testegenskapene man finner har derfor vanligvis bare gyldighet i pasientgrupper som tilsvarer dem som har vært med på evalueringen, og kan ikke uten videre overføres til andre pasientpopulasjoner. Når dette budskapet fremkommer så tydelig hos de fleste forfatterne, er det rart at man ikke klarer å foreta en avklaring når det gjelder bruken av Bayes’ teorem. Nomogrammet som har vært brukt til å beregne sannsynlighet for sykdom ved positiv test når man kjenner testens sensitivitet, spesifisitet og sykdommens prevalens (eller pre-test-sannsynlighet) har fortsatt fått sin plass i Sacketts bidrag, (som for øvrig er det mest velskrevne kapitlet). Dette til tross for at Sackett som de fleste av de andre forfatterne understreker at sensitivitet og spesifisitet ikke er konstante testegenskaper. Det burde kommet klart frem at Bayes’ teorem er en matematisk modell som sjelden bør komme til praktisk anvendelse.

I boken finner man en god gjennomgang av analysemetoder, som bruk av ROC-kurver, logistisk regresjon og beregning av konfidensintervall. Boken forutsetter basal kjennskap til klinisk epidemiologi. Den vil kunne være nyttig for leger som er i gang med evaluering av diagnostiske tester. Den er for omstendelig og lite pedagogisk skrevet til å kunne bli en inspirasjonskilde for dere som tenker på å komme i gang med slik forskning. Da vil jeg heller anbefale Sacketts Clinical epidemiology .

Hasse Melbye

Institutt for samfunnsmedisin

Universitetet i Tromsø

Anbefalte artikler