Utvalgsstørrelse for en prediksjonsmodell

    ()

    sporsmal_grey_rgb
    Artikkel

    Pasienter spør ofte legen om risikoen for nåværende eller fremtidig sykdom. I tillegg til medisinsk kunnskap og klinisk erfaring, er kliniske prediksjonsmodeller et viktig verktøy for både diagnose og prognose.

    Kliniske prediksjonsmodeller hjelper til med å forutse helseutfall eller helsetilstander. Disse modellene kan variere fra enkle trafikklyslignende metoder til komplekse «svart boks»-matematiske modeller og maskinlæring (1). Ofte brukes klassiske statistiske metoder som lineær, logistisk eller Cox-regresjon. Prediksjonsmodeller utviklet fra datasett med få deltagere, kan medføre ustabile, usikre og feilaktige prediksjoner, selv om p-verdiene er signifikante. Hvis vi bruker slike prediksjonsmodeller på nye data eller pasienter, kan de fungere dårlig (2).

    Metoder for å beregne antall deltagere

    Metoder for å beregne antall deltagere

    For prediksjonsmodeller med et kontinuerlig utfall, er den effektive utvalgsstørrelsen lik antallet deltagere. For binære utfall eller tid-til-hendelse-utfall, er den effektive utvalgsstørrelsen det laveste antall deltagere med eller uten hendelser for binære utfall, eller det totale antallet ikke-sensurerte hendelser for overlevelsesanalyse. Det betyr at i et datasett med 1000 deltagere, der bare 10 av dem har et utfall eller en hendelse, vil den effektive utvalgsstørrelsen til prediksjonsmodellen være 10, og ikke 1000. En populær tommelfingerregel er å ha minst 10 deltakere for lineær regresjon eller 10 hendelser for binære utfall eller overlevelsesanalyse per beregnet parameter (koeffisient eller stigningstall) i prediksjonsmodellen. Denne regelen er enkel, men den er basert på simuleringsstudier og er omdiskutert (3).

    En mer avansert tilnærming er å beregne den nødvendige utvalgsstørrelsen basert på grunnleggende prinsipper for en valid og stabil prediksjonsmodell. Dette innebærer et presist estimat av den samlede utfallsrisikoen eller gjennomsnittlige utfallsverdien, en lav feilmargin for estimerte verdier til alle individ og lav grad av modellens såkalte overtilpasning (4). Det er utviklet programpakker der man kan beregne nødvendig utvalgsstørrelse ved ulike betingelser og antagelser (5).

    Validitet og stabilitet

    Validitet og stabilitet

    Utvalgsstørrelsen er avgjørende for stabiliteten og validiteten til kliniske prediksjonsmodeller (2). La oss illustrere dette med et enkelt eksempel. Vi antar at det i pasientpopulasjonen er fem kontinuerlige prediksjonsvariabler som alle har samme effekt (likt stigningstall) på et kontinuerlig klinisk utfall, og at de sammen i en lineær multippelregresjonsmodell vil forklare 50 % av den totale variasjonen til utfallet. Sammenhengen mellom observerte og predikerte utfallsverdier fra en multippel regresjonsmodell i et tilfeldig utvalg med 50 pasienter er vist i figur 1a. Modellen gir best mulig tilpasning til dataene i utvalget, og avvik mellom observerte og predikerte verdier skyldes naturlig statistisk variasjon. Figur 1b viser 10 prediksjonsmodeller i 10 tilfeldige utvalg av 50 personer fra samme pasientpopulasjon, og disse er brukt til å estimere utfallet til de opprinnelige 50 pasientene i figur 1a. De predikerte utfallene varierer betydelig mellom disse 10 prediksjonsmodellene, noe som indikerer at modellene er ganske ustabile. De tilpassete linjene mellom observerte og predikerte verdier ligger heller ikke på diagonalen, noe som skyldes det statistiske fenomenet overtilpasning (6). Når utvalgsstørrelsen økes til 500 pasienter i hver de av nye 10 prediksjonsmodellene, blir både variasjonen mellom predikerte verdier fra disse modellene mindre og prediksjonen av de opprinnelige observerte utfallsverdiene bedre (figur 1c). Prediksjonsmodeller utviklet med mange deltagere er mer nøyaktige og stabile.

    Kommentarer  ( 0 )
    PDF
    Skriv ut

    Anbefalte artikler