Statistisk analyse av tidligdiagnostikk av kreft krever nye metoder

    ()

    sporsmal_grey_rgb
    Artikkel

    Metodene for å diagnostisere kreft har tradisjonelt basert seg på at alt vokser. Immunterapi og screeningstudier viser imidlertid at noen svulster forsvinner av seg selv.

    Tradisjonell forståelse av kreft, som danner grunnlaget for diagnostisering, behandling og statistiske analyser, er basert på forestillingen om at svulster vokser kontinuerlig og at spontan regresjon knapt eksisterer. Moderne immunterapi og erfaringer fra masseundersøkelser viser at det ikke alltid er slik. Dette gjør begrepet fremskyndingstid og forestillingen om at tidligdiagnostikk alltid øker sjansen for overlevelse, problematisk.

    Fremskyndingstid og preklinisk periode

    Fremskyndingstid og preklinisk periode

    Estimering av fremskyndingstid (lead time), sensitivitet og preklinisk periode (sojourn time) er sentrale begreper i evaluering av tidligdiagnostikk av kreft. Det finnes forskjellige definisjoner av fremskyndingstid, og det medfører at estimater ikke uten videre kan sammenliknes. Lange fremskyndingstider er ikke statistisk eller biologisk plausible, det er grenser for hvor små svulster man klarer å oppdage. Lange fremskyndingstider gir mye overdiagnostikk, og antagelser om lange fremskyndingstider står sentralt i evaluering av kreftscreening (1).

    Fremskyndingstid er definert som tiden diagnosen blir fremskyndet i tid når man innfører en ny type diagnostikk eller når man leter rutinemessig etter en sykdom (2).

    Sensitivitet til en undersøkelse er sannsynligheten for at undersøkelsen gjør at man klarer å diagnostisere sykdommen. Da blir (1-sensitivitet) sannsynligheten for ikke å klare å diagnostisere sykdommen, selv om den er til stede, altså sannsynlighet for falskt negative funn (2). Lav sensitivitet kan innebære både lav sannsynlighet for å diagnostisere en sykdom som virkelig er til stede (mange falskt negative), og høy sannsynlighet for at mange små lesjoner man oppdager etter hvert blir borte av seg selv (falskt positive). I det første tilfellet kan undersøkelsen gi falsk trygghet. I det andre tilfellet skapes mye unødvendig angst i tillegg til overbehandling. Det er normalt å anta at sensitiviteten synker når svulstene blir mindre. Jo mindre svulstene er, jo vanskeligere er de å oppdage. Figur 1 illustrerer sammenhengen mellom lengde på fremskyndingstid og sensitivitetsfunksjonen.

    Figur 1 Sammenhengen mellom lengde på fremskyndingstid (røde piler) og sensitivitetsfunksjonen (grønn kurve). Sojourn…
    Figur 1 Sammenhengen mellom lengde på fremskyndingstid (røde piler) og sensitivitetsfunksjonen (grønn kurve). Sojourn-periode er mellom de to heltrukne blå linjene. Blå stiplet linje til venstre er ny diagnostisk metode med lavere deteksjonsterskel, blå stiplet linje til høyre er gammel klinisk deteksjonsterskel.

    Preklinisk diagnostiserbar periode er definert som intervallet hvor det er teoretisk mulig å stille en diagnose (f.eks. ved innføring av en ny type diagnostikk) før man kan sette diagnosen klinisk. Dette kan også defineres som maksimal fremskyndingstid eller et intervall som omfatter alle mulige fremskyndingstider (fra størst mulig til minst mulig fremskyndingstid) (3). Merk at dette ikke er to identiske definisjoner – den andre definisjonen strekker seg inn i den kliniske perioden. Typisk vil sensitiviteten være minimal eller lik null i starten av den prekliniske perioden, for så å vokse til én på slutten av perioden. Når diagnostiske metoder blir mer sensitive, synker deteksjonsterskelen (illustrert med stiplet blå linje til venstre i figur 1).

    Ikke all kreft vokser monotont

    Ikke all kreft vokser monotont

    En matematisk forutsetning for å estimere fremskyndingstid er at sykdommen er monotont voksende (enten eksponentielt, log-normalt eller trinnvis voksende) (2). Svulster kan ikke gå over av seg selv i slike modeller. Noen svulster vokser fort og noen vokser sakte (4). Noen svulster vokser så sakte at individer dør av andre årsaker før sykdommen kan diagnostiseres klinisk eller gir symptomer. Dette kalles overdiagnostikk (5). Det at svulster ikke oppfører seg på en entydig måte, innebærer at tradisjonelle (eksponentielle) vekstmodeller ikke kan beskrive oppførselen til alle svulster. Derfor må hele modellverket revideres. Siden vi ikke på forhånd kan vite hvilke svulster som vil fortsette å vokse og hvilke som vil forsvinne, må vi utvikle en statistisk vekstmodell som åpner for ulike mulige scenarioer.

    Siden vi ikke på forhånd kan vite hvilke svulster som vil fortsette å vokse og hvilke som vil forsvinne, må vi utvikle en statistisk vekstmodell som åpner for ulike mulige scenarioer

    Estimert fremskyndingstid er et gjennomsnitt. Indolente subkliniske svulster og svulster som går over av seg selv på et subklinisk nivå, har per definisjon ingen fremskyndingstid (de passerer ikke linjen for klinisk deteksjonsterskel), men man kan likevel definere teoretiske fremskyndingstider for slike svulster. Dette vil medføre at gjennomsnittlig fremskyndingstid vokser dramatisk. Slike teoretiske fremskyndingstider gir lite mening, fordi de ikke kan tolkes som tiden diagnosen fremskyndes. Teoretiske fremskyndingstider estimeres ofte for screening og diagnostisering av prostatakreft og brystkreft. Det eneste medisinsk fornuftige er å estimere fremskyndingstid for svulster som er progredierende og blir til sykdom. Slike estimater kalles klinisk fremskyndingstid (5).

    Man kan enkelt sjekke om det finnes mange indolente svulster eller et reservoar av saktevoksende svulster i autopsistudier (6) eller prevalensstudier ved oppstart av store screeningprogrammer (7).

    Test 1 – estimere andel svulster med lang fremskyndingstid

    Test 1 – estimere andel svulster med lang fremskyndingstid

    Hvis det finnes mange svulster med lange fremskyndingstider (lengre enn screeningintervallene), så skal man observere en stor prevalenstopp i første screeningrunde (8). Hvis man har screening annethvert år og deteksjonsraten er den samme i første og andre screeningrunde, så er maksimal fremskyndingstid to år. Alle nye svulster oppdaget i andre screeningrunde var ikke diagnostiserbare i første screeningrunde. Hvis man deler raten i andre runde med raten i først runde, får man andelen med fremskyndingstid under to år. Ved innføring av mammografiscreening i Norge og Sverige fant man at deteksjonsraten i første og andre screeningrunde var omtrent lik for kvinner under 60 år (9, 10). Maksimal fremskyndingstid for disse kvinnene var rundt to år.

    Fremskyndingstid og volumdoblingstid

    Fremskyndingstid og volumdoblingstid

    Fremskyndingstid kan lett omregnes til volumdoblingstid. Dermed får man et relativt mål på hvor mye diagnosen fremskyndes i tid i forhold til total veksttid (5). Etter 19 volumdoblinger er diameter rundt 1 mm, men lenge før dette starter svulster å spre seg (11). Rundt 8–9 volumdoblinger senere kan man diagnostisere svulster med de mest sensitive billedteknikkene, slik som MR (tabell 1) (12, 13).

    Tabell 1

    Antall celledoblinger, antall celler, diameter, volum og medisinsk relevans for brystkreft (1113).

    Antall celledoblinger

    Antall celler

    Diameter (mm)

    Volum (mm3)

    Medisinsk relevans

    0

    1

    0,012

    0,000001

    Første kreftcelle

    19

    524 288

    1,0

    0,52

    Metastasering starter (11)

    28

    268 435 456

    8,0

    268

    Mammografisk deteksjonsterskel (13)

    29

    536 870 912

    10,0

    536

    Klinisk deteksjonsterskel (13)

    31

    2 147 483 648

    16,0

    2 148

    Gjennomsnittlig diameter i RCT-studier (13)

    40

    2,2 × 1012

    135,1

    1 099 776

    1 kg og død

    Hvis preklinisk periode ved screening er tre volumdoblinger, vil gjennomsnittlig fremskyndingstid være litt over 1,5 volumdoblinger. Dette setter et tak for hva som er realistiske tider for fremskyndingstid. Hvis volumdoblingstid er ett år, vil det ta rundt 30 år fra start til man kan oppdage svulsten klinisk. Dette er ikke rimelig. Fremskyndingstider på mer enn 1–2 år og prekliniske perioder på 3–7 år er ikke biologisk plausible. Dessuten, normalt er det slik at etter 29 volumdoblinger (når svulsten er klinisk diagnostiserbar) observerer man en avtagende veksthastighet (4). Slike lange fremskyndingstider og avtagende veksthastighet betyr også at folk i snitt vil leve 10–20 år med svulstene etter at de har blitt klinisk diagnostiserbare. Dette er også biologisk urimelig.

    Test 2 – lav sensitivitet

    Test 2 – lav sensitivitet

    Sensitivitet oppgis som et gjennomsnittsestimat for sensitivitetsfunksjonen. Sensitivitet har egentlig to fortolkninger. Som innledningsvis nevnt er dette sannsynligheten for at man klarer å diagnostisere sykdommen. Eller så er (1-sensitivitet) et estimat på tilstander som går over av seg selv. Hvis det finnes et reservoar av svulster med lange fremskyndingstider og som oppdages med lav sensitivitet, så skal dette reservoaret gradvis tømmes over flere screeningrunder og man får en synkende følge av intervallkreftrater (rate av kreft mellom to screeningtester). Hvis intervallkreftraten synker over tid, tyder dette på mange svulster med lang fremskyndingstid som oppdages med lav sensitivitet. Dette er ikke observert for brystkreft.

    Test 3 – kompensatorisk fall når screening slutter

    Test 3 – kompensatorisk fall når screening slutter

    Noen svulster vokser så sakte at noen dør av andre årsaker før en screeningoppdaget sykdom blir til klinisk sykdom. Antallet beregnes ved å regne ut kumulativ insidens for en fødselskohort fra start av screening til rundt ti år etter at screeningen er avsluttet. Nesten all økning i forekomst av sykdom under en screeningperiode skal kompenseres av en reduksjon i forekomst når man ikke lenger går til screening. Ved mammografiscreening skal det normalt bare bli rundt 2 % mer brystkreft når fremskyndingstiden er 4,8 år (8). Etter en stor økning i forekomst ved screening skal man etterpå observere et like stort kompensatorisk fall i forekomsten (8). Observert forekomst i ti år etter at screeningen er avsluttet, sammenliknes med forventet forekomst uten screening.

    Justering for fremskyndingstid

    Justering for fremskyndingstid

    Insidensrater og overdiagnostikk skal bare justeres for klinisk fremskyndingstid (5). Det er viktig å skille mellom voksende forekomst av klinisk kreft og voksende forekomst av overdiagnostiserte svulster. Det er ingen grunn til å tro at risikofaktorene er de samme for overdiagnostiserte svulster som for klinisk kreft. Overdiagnostikk kan derfor være en viktig konfunderende faktor og forklare hvorfor mange risikofaktorer for en kreftdiagnose ikke er risikofaktorer for å dø av kreftdiagnosen (14).

    Det er viktig å skille mellom voksende forekomst av klinisk kreft og voksende forekomst av overdiagnostiserte svulster

    Hvis individer har mange indolente svulster i prostata (15) og i nyrene (16) eller svulster i nyrene (16) og nevroblastom (17) som går over av seg selv, så gir screening opplagt mye overdiagnostikk. Spontan regresjon er mye mer vanlig enn hva leger flest tror – dette kan man også konkludere ut fra effekten av moderne immunterapi, som er basert på dette prinsippet (18).

    Justering for fremskyndingstid er en tvilsom statistisk praksis, fordi estimert fremskyndingstid varierer med hvordan fremskyndingstid er definert, med diagnostisk metode og hvor mye leger og individer leter etter små kliniske svulster. Dessuten, fremskyndingstid er spekulativt fordi det er en ikke-observerbar størrelse. Det er ingen grunn til å tro at justering for fremskyndingstid reduserer bias, det kan like godt øke bias.

    Kommentarer  ( 0 )
    PDF
    Skriv ut

    Anbefalte artikler