Genital Chlamydia – kan vi stole på tallene?

Kronikk
    ()

    sporsmal_grey_rgb
    Artikkel

    Nasjonalt folkehelseinstitutt har offentliggjort tall for diagnostikk av genital infeksjon med Chlamydia trachomatis i 2006. Statistikken viser både en høy andel positive prøveresultater og et rekordhøyt antall positive prøver, og indikerer dermed en økende forekomst av sykdommen. Men er det korrekt å hevde at antallet positive prøver tilsvarer antallet diagnostiserte sykdomstilfeller? Hvor mange av personene med negativt testresultat har likevel sykdommen? Vi demonstrerer hvordan testenes sensitivitet og spesifisitet er avgjørende for hvor mange prøver som gir korrekt resultat og for hvor mange prøver som er falskt positive eller falskt negative. Beregninger viser at det er behov for forbedrede testmetoder.

    I rapport nr. 7/2007 fra Meldingssystem for smittsomme sykdommer (MSIS) (1) ble tallene for laboratoriediagnostikk av infeksjoner med genital Chlamydia i Norge i 2006 presentert. Tallmaterialet nådde også nyhetsmediene (2) – (5). Antall positive tester økte fra 19 963 i 2005 til 21 259 i 2006, en stigning på 6,1 %. Antallet positive tester i 2006 var dermed høyere enn i noe foregående år. Med 275 203 testede personer i 2006 var dessuten andelen positive 7,7 %, hvilket representerer den høyeste andelen positive prøver siden slutten av 1980-årene. Disse tallene er interessante, sett i relasjon til påvisningen av en C trachomatis-klon med endret nukleotidsekvens i Sverige i 2006 (6). I tillegg til oppslag i nyhetspressen (7) har saken vært tema i flere MSIS-rapporter (8) – (10).

    Den høye andelen positive chlamydiatester har vært tatt til inntekt for at den muterte klonen ikke har fått noen stor utbredelse i Norge (9). Problemstillingen har ikke desto mindre bidratt til økt vekt på betydningen av gode diagnostiske tester – spesielt viktigheten av høy sensitivitet. Imidlertid kan det ikke utelukkes at en kombinasjon av suboptimal testspesifisitet og et stort antall analyserte prøver medfører at falskt positive resultater rent tallmessig kan utgjøre et minst like stort problem som falskt negative. I denne kronikken diskuterer vi holdbarheten av tallene for chlamydiainfeksjoner i 2006 slik de er presentert av Nasjonalt folkehelseinstitutt (1), med utgangspunkt i estimerte verdier for testmetodenes sensitivitet og spesifisitet.

    2 x 2-tabell

    2 x 2-tabell

    Falskt positive prøveresultater er et kjent problem ved screening av populasjoner med lav prevalens av sykdommen det screenes for (11). Dette kan illustreres ved bruk av en standard 2 x 2-tabell (tab 1), hvor antallet positive tester er definert som summen av sant positive (a) og falskt positive (b) tester. En ukjent andel av de 21 259 positive testresultatene i 2006 var sannsynligvis falskt positive. På samme måte er antallet negative tester i 2006 sannsynligvis ikke identisk med antallet testede uten sykdom (b + d), men summen av falskt negative (c) og sant negative (d) tester. Følgelig er andelen positive prøver heller ikke det samme som sykdommens prevalens, ettersom denne er definert som summen av sant positive (a) og falskt negative (c) i prosent av alle testede (a + b + c + d).

    Tabell 1

    Standard 2 x 2-tabell for beregning av testers testegenskaper og diagnostiske egenskaper og utvalgte variabler som kan beregnes ut fra tabellen (11)

    Sykdom +

    Sykdom –

    Test +

    a = sant positive

    b = falskt positive

    a + b

    Test –

    c = falskt negative

    d = sant negative

    c + d

    a + c

    b + d

    a + b + c + d

    Sensitivitet: a / (a + c)

    Spesifisitet: d / (d + b)

    Prevalens = pretestsannsynlighet for sykdom: (a + c) / (a + b + c + d)

    Positiv prediktiv verdi = posttestsannsynlighet for sykdom ved positiv test: a / (a + b)

    I tillegg til prevalensen, som tilsvarer pretestsannsynligheten for sykdom, kan testegenskapene (sensitivitet og spesifisitet) og de diagnostiske egenskapene (positiv og negativ prediktiv verdi) for en analyse beregnes fra verdiene for a, b, c og d i en 2 x 2-tabell (tab 1). For en kliniker som utfører screeningundersøkelser, er positiv prediktiv verdi kanskje den viktigste verdien av disse, ettersom den er identisk med posttestsannsynligheten for sykdom ved positiv test og dermed nøkkelen til å vurdere betydningen av et positivt prøvesvar.

    Slik de offisielle tallene for diagnostikk av genitale Chlamydia-infeksjoner ble presentert i MSIS-rapport nr. 7/2007 (1) og slik de også har vært gjengitt i nyhetsoppslag (2) – (5), settes det likhetstegn mellom positiv test og diagnostisert infeksjon. Det gis dermed inntrykk av at de anvendte testenes spesifisitet er 100 %. Denne fremstillingen er imidlertid misvisende, ettersom ingen av dagens chlamydiatester har 100 % spesifisitet eller 100 % sensitivitet.

    Er det så mulig å anslå hvor mange av de positive testene i 2006 som var falskt positive og hvor mange av de negative testene som var falskt negative? Svaret er ja – dersom testegenskapene (sensitivitet og spesifisitet) er kjent for testene som er benyttet.

    Analysenes testegenskaper ved screening for C trachomatis

    Analysenes testegenskaper ved screening for C trachomatis

    En metaanalyse foretatt av Cook og medarbeidere (12) viste at både sensitivitet og spesifisitet ved testing for C trachomatis med nukleinsyreamplifikasjonstester varierer i betydelig grad med anvendt analysemetode, pasientens kjønn og type prøvemateriale (tab 2, tab 3). Forfatterne samlet data fra studier der man hadde sammenholdt resultater ved testing av både urin og penselprøve fra cervix eller urethra for C trachomatis med samme type nukleinsyreamplifikasjonsmetode og der det ble presentert kjønnsspesifikke data. Inklusjon i metaanalysen forutsatte også at positive resultater var bekreftet ved dyrking eller minst én annen nukleinsyreamplifikasjonsbasert test. Inkludert i metaanalysen var henholdsvis 14 og 12 studier der man hadde evaluert testing av kvinner og menn ved hjelp av polymerasekjedereaksjon (PCR), og respektive to studier og én studie med data for testing av kvinner og menn med analyser basert på «strand displacement amplification»-metodikk (SDA). For hver studie ble 95 % konfidensintervall for sensitivitet og spesifisitet beregnet.

    Tabell 2

    Sensitivitet og spesifisitet ved testing av ulike prøvematerialer fra kvinner og menn for C trachomatis med PCR-analyser (12)

    Kjønn (antall studier)

    Kvinner (n = 14)

    Menn (n = 12)

    Prøvemateriale

    Urin (%)

    Cervix (%)

    Urin (%)

    Urethra (%)

    Sensitivitet(95 % KI)

    83,3(77,7 – 88,9)

    85,5(80,3 – 90,6)

    84,0(78,5 – 89,4)

    87,5(82,4 – 92,5)

    Spesifisitet(95 % KI)

    99,5 (99,3 – 99,8)

    99,6(99,4 – 99,8)

    99,3(98,9 – 99,7)

    99,2(98,8 – 99,6)

    Tabell 3

    Sensitivitet og spesifisitet ved testing av ulike prøvematerialer fra kvinner og menn for C trachomatis med SDA-analyser (12)

    Kjønn (antall studier)

    Kvinner (n = 2)

    Menn (n = 1)

    Prøvemateriale

    Urin (%)

    Cervix (%)

    Urin (%)

    Urethra (%)

    Sensitivitet(95 % KI)

    79,9(73,3 – 86,4)

    93,6(91,2 – 96,1)

    93,1(87,7 – 96,7)

    92,4(86,8 – 96,2)

    Spesifisitet(95 % KI)

    99,1(97,7 – 100)

    97,9(97,3 – 98,5)

    93,8(90,7 – 95,1)

    96,3(94,3 – 97,8)

    Som vist i tabell 2 og tabell 3 varierte sensitiviteten fra 79,9 % til 93,6 % og spesifisiteten fra 93,8 % til 99,6 %, avhengig av testmetode, kjønn og prøvemateriale.

    For å beregne samlet sensitivitet og spesifisitet ved testing av de 275 203 prøvene i 2006 kreves det altså eksakt informasjon om hver enkelt prøve med hensyn til prøveresultat, hvilken test som er brukt, prøvegivers kjønn og type prøvemateriale. Dette oppgis ikke til Meldingssystem for smittsomme sykdommer (MSIS), men noen generelle data er kjent.

    I et brev til alle de mikrobiologiske laboratoriene i Norge, datert 6.11. 2006, offentliggjorde Nasjonalt folkehelseinstitutt en oversikt over hvilke tester som ble brukt til å påvise C trachomatis ved norske mikrobiologiske laboratorier i de første ni månedene av 2006. Tre kommersielle nukleinsyreamplifikasjonstester var i bruk i denne perioden. BD ProbeTec fra Becton, Dickinson and Company, USA, baserer seg på SDA-teknologi og ble benyttet ved analysering av 58 % av prøvene. De to PCR-testene Cobas Amplicor og Cobas TaqMan48 fra Roche Diagnostics, Sveits, ble benyttet ved analysering av henholdsvis 15 % og 20 % av prøvene. De resterende 7 % av prøvene ble testet med egenutviklede PCR-analyser.

    Når det gjelder kjønnsfordelingen, opplyser Nasjonalt folkehelseinstitutt at av de 21 259 positive prøvene i 2006 var 61 % hentet fra kvinner og 38 % fra menn (1). Overvåkingsdata sier ikke noe om kjønnsfordelingen for de 253 944 negative prøvene. I tidligere epidemiologiske studier foretatt i Norge og Danmark har imidlertid menn stått for mellom 7 % og 9 % av innsendte prøver til testing for C trachomatis (13) – (15).

    Nasjonal statistikk for fordeling på prøvematerialer foreligger ikke, men egne data fra AS Telelab for 2006 viser at tre av fire prøver til chlamydiadiagnostikk var penselprøver og én av fire urin (upubliserte data).

    På grunnlag av resultatene fra metaanalysen (12) samt ovennevnte bakgrunnsdata vedrørende fordeling på analysemetoder, prøvematerialer og kjønnssammensetning, kan et mulig estimat av samlet sensitivitet for testing på C trachomatis i Norge i 2006 være 88 %. Nedenfor benyttes denne verdien sammen med to alternative estimater for spesifisitet (99 % respektive 97 %) i regneeksempler.

    Analysenes diagnostiske egenskaper ved screening for C trachomatis

    Analysenes diagnostiske egenskaper ved screening for C trachomatis

    Når sensitivitet, spesifisitet, antall utførte analyser og antall positive prøver er kjent, kan antall syke beregnes ved hjelp av formelen i ramme 1. Deretter kan antallet sant positive (a), falskt positive (b), falskt negative (c) og sant negative (d) tester kalku-leres ved hjelp av formler for sensitivitet og spesifisitet (tab 1). Tabell 4 og tabell 5 viser hvordan de testede fordeler seg på feltene a, b, c og d i en 2 x 2-tabell ved sensitivitet og spesifisitet på 88 % og 99 %, respektive 88 % og 97 %.

    Tabell 4

    2 X 2-tabell med resultater fra testing for genital C trachomatis-infeksjon i Norge i 2006 ved sensitivitet på 88 % og spesifisitet på 99 %

    Sykdom +

    Sykdom –

    Test +

    18 720

    2 539

    21 259

    Test –

    2 553

    251 391

    253 944

    21 273

    253 930

    275 203

    Tabell 5

    2 x 2-tabell med resultater fra testing for genital C trachomatis-infeksjon i Norge i 2006 ved sensitivitet på 88 % og spesifisitet på 97 %

    Sykdom +

    Sykdom –

    Test +

    13 462

    7 797

    21 259

    Test –

    1 836

    252 108

    253 944

    15 298

    259 905

    275 203

    Ramme 1

    Formel for beregning av antall syke (S+) når sensitivitet, spesifisitet, antall utførte analyser (T) og antall positive prøver (T+) er kjent

    Tabell 4 viser at dersom den samlede sensitiviteten ved testingen var 88 % og samlet spesifisitet var 99 %, hadde 2 553 personer falskt negativ test og 2 539 personer falskt positiv test. Dette gir forholdet 1 : 1 mellom falskt negative og falskt positive resultater. Til sammen fikk 1,9 % av alle testede et galt testresultat, og 12 % av alle positive prøveresultater var falskt positive. Pretestsannsynligheten for sykdom, som er lik prevalensen av sykdom i den testede gruppen, var 7,7 %. Positiv prediktiv verdi, som tilsvarer posttestsannsynlighet for sykdom ved positivt prøveresultat, var 88,1 %.

    Dersom spesifisiteten var 97 % og ikke 99 %, men sensitiviteten fortsatt var 88 %, endres tallene betydelig. Tabell 5 viser at antallet falskt positive tester i så fall øker til hele 7 797. Dersom de anvendte verdiene for sensitivitet og spesifisitet er korrekte, var så mange som 37 % av de positive testene falskt positive. Dernest reduseres antallet falskt negative prøveresultater til 1 836, slik at forholdet mellom falskt negative og falskt positive prøver med disse testegenskapene var omtrent 1 : 4. Videre synker prevalensen av sykdom, som altså tilsvarer pretestsannsynligheten for sykdom i den testede populasjonen, fra 7,7 % til 5,6 %. Samtidig svekkes testenes diagnostiske verdi betydelig ved at positiv prediktiv verdi, som tilsvarer posttestsannsynlighet for sykdom ved positivt prøveresultat, reduseres fra 88,1 % til 63,3 %. Dette innebærer at testenes diagnostiske styrke er om lag 28 % lavere ved en samlet spesifisitet på 97 %, sammenholdt med en samlet spesifisitet på 99 %, forutsatt samme sensitivitet på 88 %.

    Konklusjon

    Konklusjon

    Sikre verdier for sensitivitet og spesifisitet ved screening for genital C trachomatis-infeksjon foreligger ikke, ettersom disse i stor grad varierer med prøvetakingsmateriale, pasientens kjønn og anvendt testmetode. Våre beregninger viser imidlertid at det med dagens tester må påregnes et betydelig antall både falskt positive og falskt negative prøveresultater ved screening. For å få sikrere kunnskap om prevalens og større diagnostisk treffsikkerhet behøves mer detaljert rapportering til MSIS og tester med forbedrede testegenskaper. Fagfolk som offentliggjør laboratoriedata har et særskilt ansvar for å informere om at alle analyseresultater er beheftet med en viss grad av usikkerhet. Klinikere bør være oppmerksomme på muligheten for falskt positive prøveresultater så vel som falskt negative, spesielt ved screening av personer med antatt lav risiko for sykdommen.

    Vi takker rådgiver Hilde Kløvstad ved Nasjonalt folkehelseinstitutt for velvillig bistand i forbindelse med innsamling av data.

    Oppgitte interessekonflikter: Ingen

    PDF
    Skriv ut

    Anbefalte artikler

    Laget av Ramsalt med Ramsalt Media