Fremskrivning fra siste observasjon

Stian Lydersen Om forfatteren

I en longitudinell studie kan det mangle data på ett eller flere tidspunkt for noen av deltakerne. Fremskrivning fra siste observasjon (LOCF) er en enkel metode for å fylle ut manglende verdier, men den har vesentlige svakheter.

Manglende data kan skyldes deltakere som forsvinner ut av studien eller midlertidig uteblir ved ett eller flere oppfølgingstidspunkt. En metode for å håndtere manglende data i longitudinelle studier kalles fremskrivning fra siste observasjon (last observation carried forward, LOCF). I noen studier brukes måling ved utgangstidspunktet og én måling etter (baseline observation carried forward, BOCF). Disse metodene går ut på følgende: Dersom en verdi mangler, føres siste observerte verdi inn i de fremtidige verdier der denne mangler. Dette er illustrert i figur 1. I dette eksempelet ser vi at utfallsvariabelen øker med økende tid hos de enkelte deltakerne. I dette tilfellet vil metoden gi en systematisk underestimering av de manglende verdiene. Men hva gjelder generelt?

Figur 1 Fremskrivning fra siste observasjon (LOCF). A viser et komplett datasett for fire deltakere på tre tidspunkt. Dersom verdiene merket med X mangler og er ukjente, settes siste observerte verdi inn isteden (markert ved en pil i B).

Er metoden konservativ?

Metoden har vært mye brukt, blant annet i randomiserte kontrollerte forsøk. U.S. Food and Drug Administration har tidligere anbefalt metoden, idet den ble ansett som konservativ (1, s. 16–17). Konservativ betyr skjevhet (bias) slik at effekten av behandlingen underestimeres. Men det viser seg at metoden kan gi skjevhet i begge retninger og at den kan medføre skjevhet også hvis data mangler helt tilfeldig (2, s. 47–50). På forespørsel fra U.S. Food and Drug Administration ble det nedsatt et utvalg som skulle gi råd om håndtering av manglende data i kliniske forsøk. I utvalgets rapport fra 2010 anbefales det at verken LOCF- eller BOCF-prinsippene bør brukes for å håndtere manglende data, med mindre de underliggende forutsetningene er vitenskapelig underbygget (3, s. 77).

I den omfattende Handbook of Missing Data Methodology fra 2015 står det: «LOCF er ikke gyldig under generelle forutsetninger, er ikke basert på statistiske prinsipper, den er ikke en fornuftig metode og bør ikke brukes» (4, s. 40, forfatterens oversettelse). Metoden blir generelt frårådet også i andre nyere bøker om manglende data (1, s. 16, 5, s. 11, 6, s. 59). Avslutningsvis vil jeg sitere Vickers & Altman (7): «LOCF er en attraktiv metode fordi den er enkel, men lite annet taler til dens fordel» (forfatterens oversettelse).

Bedre alternativer

Det finnes bedre alternativer for håndtering av manglende data. I en longitudinell studie kan for eksempel en lineær blandet modell-regresjonsanalyse være velegnet. Når denne metoden brukes, behøver man ikke å imputere manglende data. Alle data vil inngå i analysen, også fra deltakerne som mangler data på ett eller flere tidspunkt. Og resultatene er forventningsrette når data mangler betinget tilfeldig (5, s. 130, 8).

1

van Buuren S. Flexible imputation of missing data. 2. utg. Boca Raton, FL: CRC Press, 2018.

2

Molenberghs G, Kenward MG. Missing data in Clinical Studies. Chichester: Wiley, 2007.

3

National Reseach Council. The prevention and treatment of missing data in clinical trials. Washington, DC: National Academies Press, 2010.

4

Carpenter JR, Kenward MG. Development of methods for the analysis of partially observed data and critique of ad hoc methods. I: Molenberghs G, Fitzmaurice G, Kenward MG et al. Handbook of missing data methodology. 2. utg. CRC / Champan Hall, 2014: 23–46.

5

O’Kelly M, Ratitch B. Clinical trials with missing data. A guide for practitioners. Chichester: Wiley, 2014.

6

Mallinckrodt CH. Preventing and treating missing data in longitudinal clinical trials: a practical guide. Cambrigde: Cambridge University Press, 2013.

7

Vickers AJ, Altman DG. Statistics notes: missing outcomes in randomised trials. BMJ 2013; 346: f3438. [PubMed][CrossRef]

8

Lydersen S. Manglende data – sjelden helt tilfeldig. Tidsskr Nor Legeforen 2019; 139. doi: 10.4045/tidsskr.18.0809. [PubMed][CrossRef]

Kommentarer

(0)

Anbefalte artikler