Evaluering av medisinske metoder – kan vi stole på kostnad-effekt-analyser?

Ivar Sønbø Kristiansen, Knut Stavem, Kristin Linnestad, Kjeld Møller Pedersen Om forfatterne
Artikkel

De samlede kostnader til det norske helsevesen var i 1950 ca. 6,9 milliarder (1), mens de var ca. 101 milliarder i 1999, alt målt i 1999-kroner (2). Helsevesenet har således hatt sterk vekst de siste 50 år, trass i alle påstander om nedskjæringer. Mens institusjonssektorens totale utgifter var 22,4 milliarder kroner i 1990, var de 42,5 milliarder i 2000, tilsvarende 28,2 milliarder 1990-kroner (en realvekst på ca. 26 %) (3). Til sammenlikning har dansk sykehusvesen hatt en realvekst på ca. 19 % i perioden 1988 – 99, trass i at danske sykehus neppe hadde flere ressurser enn norske i 1988 (4). Helsesektorens sterke vekst har selvsagt mange årsaker. Økt etterspørsel etter helsetjenester pga. økende folketall og aldrende befolkning er viktige forklaringer. Mange mener likevel at forhold på tilbudssiden er de viktigste forklaringsfaktorer, og det er ingen tvil om at nye diagnostiske og behandlingsmessige metoder – ny «teknologi» – har vært en viktig drivkraft bak veksten.

De mange fremskrittene betyr bedre helse for pasientene, men også større press på knappe ressurser. Dette har tvunget frem strengere og mer eksplisitte prioriteringer. Økonomisk evaluering har derfor fått økende anvendelse. I en del industrialiserte land har man tatt i bruk økonomiske analyser for å vurdere om medikamenter skal finansieres over offentlige budsjetter (blåreseptordning o.l.), og fra 1.1. 2002 er det obligatorisk for legemiddelfirmaer å legge frem økonomiske analyser når de søker om trygderefusjon i Norge. Det er også ventet at det nasjonale prioriteringsrådet, som nylig er oppnevnt, vil bruke kostnadseffektivitet som ett av flere kriterier når det gir råd i prioriteringsspørsmål.

Bruken av økonomisk evaluering har vært møtt av kritiske røster. Noen hevder at det er uetisk å ta økonomiske hensyn når man skal behandle syke mennesker. De fleste vil nok likevel mene at ressursene er knappe og at økonomiske argumenter er relevante fordi ressurser brukt på én pasient til sjuende og sist vil bety at en annen pasient mister muligheten for behandling. En viktig innvending mot bruk av økonomiske analyser i prioritering er imidlertid at resultatene kan variere og at to ulike analyser kan gi vidt forskjellige svar.

I denne artikkelen gir vi først en generell beskrivelse av ulike typer økonomiske analyser, deretter presenterer vi to eksempler på økonomisk evaluering med sprikende resultater. Til slutt diskuterer vi årsakene til at resultatene er motstridende.

Metode og valg ved økonomisk evaluering

Hensikten med økonomisk evaluering er å måle kostnader og nytte ved helsetiltak slik at nytten blir størst mulig innenfor et gitt budsjett. For dette formål finnes flere typer analyser. Nytte-kostnad-analyse (engelsk cost-benefit analysis –CBA) er i prinsippet en omfattende form for økonomisk analyse der man sammenlikner alle ressurser som et tiltak (diagnostikk, behandling mv.) krever med all nytte som skapes ved tiltaket (tab 1). Både kostnad og nytte måles i samme monetære enhet. I praksis innbærer nytte-kostnad-analyse en sammenlikning av de kostnader og nyttekomponenter som relativt enkelt kan uttrykkes monetært, mens nyttekomponenter som er vanskelige å måle i kroner, ofte blir utelatt. Metoden begrenses derfor av måleproblemer både for kostnader og nytte.

Kostnad-effekt-analyse (engelsk cost-effectiveness analysis – CEA) er en metode hvor man sammenlikner kostnad og effekt for to eller flere alternative tiltak eller programmer, og hvor effekten (nytten) måles i naturlige enheter, f.eks. vunne leveår eller oppdagede krefttilfeller (tab 1). Et spesialtilfelle av denne analysetypen foreligger når to eller flere alternative behandlinger har samme effekt og man bare behøver å måle kostnader (kostnadsminimeringsanalyse). Effekten kan måles med tradisjonelle mål som for eksempel vunne leveår, redusert antall sykdomsepisoder, sykmeldingsepisoder etc. Mange slike nyttemål er relevante bare for et fåtall behandlingstyper, og kostnad-effekt-analyser har derfor begrenset anvendelse i prioriteringssammenheng såfremt nytten ikke er målt i vunne leveår.

«Cost-utility»-analyse (CUA) er en variant av kostnad-effekt-analyse, hvor effekten av alternative behandlingsmetoder uttrykkes som verdien eller nytten (engelsk: utility) av å forbedre en gitt helsetilstand. Nytten kan måles med flere metoder, f.eks. som livskvalitet på en skala fra 0 (død) til 1 (helt frisk). Slike skalaer har spesielle egenskaper i overensstemmelse med økonomisk teori og kan benyttes til å beregne kvalitetsjusterte leveår (quality-adjusted life years, QALY). For eksempel gir en ny teknologi som forbedrer livskvaliteten med 0,2 i fire år en gevinst på 0,8 QALY (0,2 ¥ 4). Bruk av QALY gir muligheter for å sammenlikne effekter av programmer av høyst ulik natur, i motsetning til de begrensede mulighetene som ligger i effektmålet ved kostnad-effekt-analyser.

Økonomiske analyser kan baseres på prospektive og retrospektive undersøkelser, randomiserte studier eller på modeller. Ofte bygger økonomiske analyser på hybride modeller, hvor informasjon fra en rekke kilder samles inn og benyttes i en databasert beslutningsmodell.

I en økonomisk analyse må forskeren foreta mange valg. For at analysen skal være konsistent, må man velge ett perspektiv (for eksempel sykehusets eller helseforetakets perspektiv) og beregne kostnader og effekter ut fra dette. Ofte er det ved innføring av medisinsk teknologi aktuelt å se problemet fra samfunnets side, hvilket innebærer at alle kostnader og nyttekomponenter inkluderes. Det må også være konsistens i håndtering av kostnader og nytte på forskjellige tidspunkter, og det er derfor vanlig å konvertere alle verdier til verdier på ett og samme tidspunkt (diskontere), f.eks. beregne verdien av alle fremtidige kostnader og nytte i dag, også kalt nåverdien. Videre må vi ha et utgangspunkt for sammenlikning. Enten kan vi sammenlikne med dagens behandling eller med andre spesifiserte alternativer. Ved sammenlikning av ulike alternativer, f.eks. i forbindelse med fordeling av økonomiske ressurser, snakker vi ofte om alternativ kostnad, dvs. det offeret man må gjøre ved å unnlate å bruke ressursene i det beste alternative prosjekt.

Valg av analysemetode, perspektiv, nåverdiberegning, effektmål og kostnadsberegning kan ha stor innflytelse på resultatet av økonomiske analyser. Valgene kan være usikre og påvirkelige av forskernes verdivalg. For å synliggjøre hvordan resultatene av en analyse varierer med valg av forutsetninger, er det et krav at man viser hvordan resultatet varierer med endrede forutsetninger. Dette gjøres i sensitivitetsanalyser, der man viser hvordan variasjon i én eller flere faktorer påvirker analysens konklusjon. I analysene er det usikkerhet ved en rekke forhold, både medisinske variabler (forekomst av sykdom, behandlingseffekt, risiko for bivirkninger, mortalitet etc.), kostnadsestimater eller diskonteringsrater.

Tabell 1 Hovedtyper økonomisk evaluering av helsetiltak

Analysetype

Kostnadsmål

Nyttemål

Nytte-kostnad-analyse (engelsk: cost-benefit analysis – CBA)

Monetær enhet (kroner, ı, £, $, etc.)

Monetær enhet

Kostnad-effekt-analyse (engelsk: cost-effectiveness analysis – CEA)

Monetær enhet

Helsegevinsten måles i «naturlige» enheter, så som vunne leveår, unngåtte sykdomsepisoder, symptomfrie uker etc.

Kostnadsminimeringsanalyse

Monetær enhet

De behandlinger som sammenliknes, antas å ha samme effekt, og bare kostnader kvantiteres

Cost-utility analysis (CUA)

Monetær enhet

Quality Adjusted Life Years (QALY) (kvalitetsjusterte leveår)

Beslutningstre for analyse av misoprostolbruk hos pasienter som bruker ikke-steroide antiinflammatoriske midler NSAID (6).

Modeller

Økonomiske analyser kan utføres med basis i kliniske studier såfremt disse inkluderer måling av helseeffekter så vel som livskvalitet og kostnader. En slik økonomisk analyse er relevant bare for landet den er utført i, fordi ressursbruk og kostnader varierer mye fra land til land selv for identiske medisinske tilstander. Når de kliniske data danner grunnlag for økonomisk evaluering i andre land, må det gjøres tilpasninger av kostnadsdata for at analysen skal bli relevant. I slike tilfeller utgjør den kliniske studien en modell for økonomiske analyser i andre land. I mange, kanskje de fleste tilfeller, finnes det ingen enkelt studie som kan benyttes som utgangspunkt for økonomiske analyser. I slike tilfeller må man basere analysen på informasjon fra mange ulike kilder og simulere antatt kostnad og nytte i en aktuell situasjon. Simuleringen gjøres typisk ved å utvikle en modell i et dataprogram (regneark o.a.).

I helseøkonomi anvendes som regel modeller av typen beslutningstrær (5, 6). Figur 1@, som finnes på Internett, viser et beslutningstre som illustrerer hva som kan skje når man gir en pasient to ulike medikamenter for leddgikt. Modellen inkorporerer sannsynligheter og kostnader og gir mulighet for å beregne kostnad per vunnet leveår ved å velge ett medikament fremfor et annet. Figur 2@ viser en Markov-modell som ble utviklet for å tallfeste de økonomiske konsekvenser av tobakksrøyking (7). Figuren illustrerer formodentlig at bare et fåtall forskere vil ha full innsikt i hvordan en komplisert Markov-modell fungerer.

Simuleringsmodeller er fleksible instrumenter som kan anvendes på ulike behandlingsformer, på ulike pasientgrupper og i ulike land. Modeller blir imidlertid lett kompliserte dersom de skal reflektere medisinsk praksis med mange beslutninger og utfall. Kompleksiteten kan gjøre modellene lite transparente og resultatene av analysen kan derfor manipuleres dersom man skulle ønske det.

Markov-modell for estimering av effekter av tobakksrøyking (7)

Økonomisk evaluering av kardiodefibrillator

Hvert år rammes ca. 5 000 nordmenn av plutselig hjertestans pga. hjertearytmi. Implanterbar kardiodefibrillator som plasseres subkutant utenpå brystkassen med elektroder til myokard kan forebygge arytmidødsfall (8). Kliniske tester startet i 1980, og metoden ble tatt i bruk i Norge i 1984. Dette er nå rutinebehandling ved alle norske universitetsklinikker. De siste fem år har det årlige antall behandlinger vært ca. 100 på landsbasis (8).

Kardiodefibrillator er åpenbart livreddende i en del tilfeller, men metoden har likevel vært noe omdiskutert pga. de høye kostnadene. Batteri, generator og elektroder koster i størrelsesorden 200 000 kroner i førstegangsanskaffelse. Hertil kommer kostnader ved kontroll og batteriskifte. Kardiodefibrillator har vært analysert i en rekke kostnad-effekt-analyser med vunne leveår som nyttemål. De første analysene var basert på simulering av kostnader og leveårsgevinster i modeller (9, 10). Konklusjonen i disse analysene var at leveårsgevinsten i gjennomsnitt var ca. to år, og at kostnaden per vunnet leveår var i området 15 000 engelske pund (11) til 31 000 amerikanske dollar (10). Økonomiske analyser med utgangspunkt i senere publiserte randomiserte studier indikerte en leveårsgevinst på 0,84 år ved fire års oppfølging (12), henholdsvis 0,26 etter seks års oppfølging (13). Kostnaden per vunnet leveår var henholdsvis 27 000 amerikanske dollar og 213 000 kanadiske dollar (tilsvarende ca. 140 000 amerikanske dollar).

Dersom man mener at det offentlige skal finansiere medisinske metoder der kostnaden per vunnet leveår er under 250 000 kroner, ville altså de første økonomiske analyser gi et tydelig klarsignal, mens de senere publikasjoner gir rødt lys for metoden. De sprikende resultatene er dårlig nytt for beslutningstakere som ønsker å gjøre ressursallokeringer på grunnlag av økonomisk evaluering. Det kan nemlig se ut til at det finnes økonomiske analyser som kan rettferdiggjøre enhver beslutning.

Den viktigste årsaken til sprikende resultater er at de første analysene var bygd på tro og forhåpninger snarere enn dokumenterte effekter. Når klinikerne med egne øyne så at pasientene overlevde etter elektrosjokk fra kardiodefibrillator, var det rimelig å tro at det man observerte i pasientserier, var uttrykk for teknologiens effekt. Randomiserte, kontrollerte studier der effekter av seleksjon og annen skjevhet er fjernet, og der eventuelle negative effekter av metoden også fremkommer, tyder imidlertid på at leveårsgevinsten er mer beskjeden enn de første modellanalysene skulle tilsi.

Når forskjellene i kostnad per vunnet leveår er såpass store enten man bruker simuleringsmodeller eller kliniske studier, skyldes dette et samspill mellom ulike faktorer. Leveårsgevinsten ved kardiodefibrillator påvirkes i betydelig grad av pasientens alder og kjønn (alminnelige leveutsikter) og eventuelle grunnsykdommer utover hjertearytmi. Ekstragevinsten (marginalnytten) av metoden avhenger dessuten av sammenlikningsgrunnlaget. Jo bedre behandling pasienter i kontrollgruppen får, desto mindre ekstra er det å vinne på kardiodefibrillator. I én analyse antok man at opptil 50 % av pasienter som fikk medikamentell behandling gikk over til defibrillator ved «medikamentsvikt», og det kan naturligvis utviske forskjeller mellom behandlings- og kontrollgruppen når forskjellen vurderes på basis av den behandling de i utgangspunktet skulle ha hatt (14).

Også på kostnadssiden er det betydelig variasjon. Det skyldes stor variasjon i behandlingsopplegg både ved medikamentell behandling og ved bruk av kardiodefibrillator. Utstyrskostnader kan variere både etter land og produsent, og sykehusbehandling vil typisk ha langt høyere kostnader i USA enn f.eks. i Norge. Utstyrskostnader faller oftest over tid, men dette fallet kan motvirkes av overgang til mer avansert og kostbart utstyr. En amerikansk studie tyder imidlertid på kostnadseffektiviteten ved defibrillator bedres over tid fordi batteriene har fått lengre levetid (12).

Økonomisk evaluering av screening for lungekreft

Lungekreft er den vanligste kreftform i verden, vurdert både etter nye tilfeller (1,04 millioner per år) og dødsfall (0,92 millioner per år) (15). Prognosen for lungekreft er dyster, med en femårsoverlevelse på i gjennomsnitt 8 % i Europa og 14 % i USA (15). Prognosen i Norge er blitt ubetydelig bedre de siste 30 år, med 9 % femårsoverlevelse i perioden 1989 – 93 (16).

Omkring 20 – 25 % av lungekrefttilfellene er småcellet lungekreft, som metastaserer tidlig og kan betraktes som en systemisk sykdom. De resterende 75 – 80 % av tilfellene antas å kunne helbredes om tilstanden oppdages tidlig, men lungekreft gir sjelden symptomer så tidlig at kurativ behandling er mulig. Omkring 25 % av ikke-småcellet lungekreft diagnostiseres i stadium I-IIIA og kan opereres med et kurativt siktemål.

For å bedre overlevelsen ved ikke-småcellet lungekreft er det rimelig å vurdere teknikker som kan oppdage kreft før svulsten gir symptomer. Screening med røntgen thorax alene eller kombinert med cytologi av sputum har ikke vist sikker økning i overlevelse, men studiene har klare metodebegrensninger (17).

Utvikling av lavdose spiralcomputertomografi (spiral-CT) med bedre oppløsning, lavere stråledose og kortere tid for gjennomføring av undersøkelsen har inspirert flere forskergrupper til å vurdere denne teknologien for lungekreftscreening. Lavdose spiral-CT har god evne til å vise perifere, små svulster, men er ikke like godt egnet til å oppdage sentrale svulster (18). Metoden har ført til en endring i stadiefordeling i retning av tidligere diagnostikk (19). Metodens sensitivitet (evne til å oppdage svulster) er rapportert å være i området 55 – 93 %, spesifisiteten er 79 – 97 % (19 – 21). Det er uenighet om hvilken plass spiral-CT fortjener i diagnostikken av lungekreft (22, 23), men leveårsgevinstene kan tenkes å være betydelige fordi lungekreft ofte rammer relativt unge mennesker.

De siste to årene er det gjort flere kostnad-effekt-analyser av spiral-CT-screening for lungekreft (24, 25). En enkel analyse av 200 screeningoppdagede svulster med hypotetiske fremskrivninger av effekter og kostnader (26) antydet at screening kan være kostnads-effektivt. I en annen analyse av engangsscreening i en høyrisikogruppe i alderen 60 – 74 år med prevalens av lungekreft på 2,7 % ble det anslått at kostnaden per vunnet leveår var 5 940 amerikanske dollar, hvilket må ansees å være meget kostnadseffektivt (25). De samme forfatterne fant at kostnaden var ca. 23 100 dollar i en populasjon med lavere risiko (prevalens av lungekreft 0,7 %) med screening hvert år i fem år (24). Resultatet var i stor grad avhengig av overlevelsesgevinsten ved screening, mens resultatene var mindre følsomme for endringer i insidensen av lungekreft i populasjonen og kostnader ved screening og etterundersøkelser (24). Grunnlagsdataene for disse analysene er imidlertid ikke basert på randomiserte studier. Resultatene må derfor betraktes som foreløpige og tolkes med forsiktighet (27, 28).

Analysene påvirkes av om viktige kostnader er utelatt i en analyse, eller at det ikke er tatt høyde for praktiske problemer i gjennomføringen av et screeningprogram. Dersom deltakerandelen blir lav ved screening, vil det kunne svekke kostnadseffektiviteten. Det samme kan være tilfellet om andelen dagligrøykere synker i befolkningen. Kommersiell markedsføring og «villscreening» kan medføre at screeningressurser blir brukt på grupper med lav lungekreftrisiko (29, 30). Bruk av supplerende teknikker som serologiske tester, automatisert cytologisk undersøkelse av spytt og genteknologiske tester kan alle tenkes å påvirke kostnadseffektiviteten ved lungekreftscreening. En omfattende screening med for eksempel årlig undersøkelse av alle røykere over 40 år med et totalforbruk tilsvarende en pakke sigaretter daglig i 20 år ville innebære et svært stort antall radiologiske undersøkelser og vil kunne øke det nasjonale behov for radiologer. En serie andre faktorer, så som kostnader til utstyr, hyppighet av screening, standarder for tolking av funn, etterundersøkelser mv., kan påvirke kostnadseffektiviteten av lungekreftscreening (31).

Foreløpig er det betydelig usikkerhet med henblikk på en rekke faktorer i forbindelse med lungekreftscreening. I særlig grad gjelder dette effekten på overlevelse, fordi man savner data fra randomiserte studier. Dersom det er riktig at lungekreft kan spontanregredere (32), vil det naturligvis også ha stor betydning for kostnader og nytte. All denne usikkerheten må nødvendigvis gjenspeile seg i økonomisk evaluering av lungekreftscreening. Jo mindre den medisinske usikkerheten blir, desto sikrere og nyttigere vil de økonomiske analysene bli.

Hvorfor varierer resultatene i økonomisk evaluering?

Variasjon i resultatene fra økonomisk evaluering kan i prinsippet skyldes variasjon i nytte- og kostnadsestimater. Når det gjelder de siste, baseres disse på data om forbruk av ressurser (personell, utstyr, forbruksmateriell mv.). Fordi helsevesenet foreløpig har lite utviklede informasjonssystemer, blir data både om ressursforbruk og hva ressursene koster i kroner nødvendigvis usikre. På dette området er man oftest ikke så godt hjulpet med data fra utlandet. Uenighet om metodevalg vil også kunne påvirke resultatene. Det er f.eks. uenighet om kostnader knyttet til planlegging av kliniske undersøkelser skal betraktes som behandlingskostnader.

Når det gjelder estimering av nytte, baseres denne på de kliniske studier og eventuelt på livskvalitet dersom nytten måles i kvalitetsjusterte leveår. Det er nok en tendens til å tro at de kliniske studier, og da først og fremst de randomiserte forsøkene, gir sikre svar. Så enkelt er det imidlertid ikke. Det er ikke uvanlig at selv store randomiserte studier gir motstridende resultater (33), og man gjør nok klokt i å tolke randomiserte studier med varsomhet (34). Det kan i den forbindelse være verdt å merke seg at ulike eksperter har ulike oppfatninger om klinisk effekt endog når de baserer seg på de metananalyser som antas å være av god kvalitet (35). Heller ikke måling av livskvalitet er et uproblematisk arbeidsfelt. Til tross for en betydelig innsats både teoretisk og empirisk er helseøkonomer fortsatt til dels svært uenige om hvordan man skal måle pasientpreferanser og livskvalitet. Det er heller ingen tvil om at valg av metode i noen tilfeller kan ha betydelig innflytelse på resultatet av den økonomiske analysene. Denne type usikkerhet stammer imidlertid fra det faktum at det er uenighet om hvordan man skal verdsette ulike typer helsegevinster. Denne uenigheten er til stede både blant leger, økonomer og i befolkningen i sin alminnelighet.

Det er flere årsaker til at økonomiske analyser kan oppfattes som mer usikre enn kliniske studier. For det første er en god økonomisk analyse eksplisitt i alle forutsetninger den bygger på og på usikkerheten i konklusjonene. Dette gjør det lett for brukeren å se svakheter i analysene. Man kan lett tolke analysene som dårligere enn analyser der usikkerhet og begrensninger ikke nevnes eksplisitt. For det andre må økonomisk evaluering av en medisinsk behandlingsmetode nesten alltid bygge på ekstrapoleringer fra kliniske studier. Man analyserer typisk en pasientgruppe i ett land med effektdata for andre pasienter i andre land. Legene må i sin kliniske praksis gjøre det samme, men har liten tradisjon for å gjøre forutsetningene eksplisitte. Økonomiske analyser av defibrillatorbehandling og lungekreftscreening er eksempler på analyser hvor usikkerhet i analysene i hovedsak stammer fra usikkerhet i effektestimater. At de aller fleste i dag tror at defibrillator er en livsforlengende behandling, betyr ikke at alle er enige om hvor stor forlengelsen er.

Selv om mye av usikkerheten i økonomisk evaluering kan forklares med høyst forståelig usikkerhet i effekt- og kostnadsdata, betyr dette likevel ikke at enhver økonomisk analyse har god kvalitet. Tvert imot tyder systematiske oversikter på at kvaliteten på publikasjonene er heller beskjeden (36). Et av problemene er at mange analyser publiseres i medisinske tidsskrifter, der de faglige medarbeiderne ikke har den nødvendige kompetanse i økonomisk evaluering. Økonomiske analyser bør derfor ikke brukes i helsepolitikken før de er underkastet kompetent kvalitetskontroll.

Konklusjon

Resultatene av økonomisk evaluering av helsetiltak kan variere mye fra én undersøkelse til en annen. En del av denne variasjonen skyldes usikkerhet i kostnads- eller livskvalitetsdata, men oftere ligger nok forklaringen i usikkerhet i medisinske effektdata. Dessuten kan variasjonen skyldes ulikhet i pasientgrupper eller andre forhold. Variasjonen gir grunn til å tolke økonomiske analyser med varsomhet. I den grad økonomiske analyser er bygd på usikker informasjon, vil usikkerheten være et problem både for pasienten og for legen som skal treffe beslutninger. Når økonomiske analyser kan fremstå som mer usikre enn klinisk praksis, er nok grunnen at usikkerheten er mer eksplisitt i den formelle økonomiske analysen.

Fakta
  • Økonomisk evaluering vil trolig få økende betydning i helsepolitikken

  • Økonomiske analyser kan gi meget varierende resultater og bør tolkes med varsomhet

  • Usikkerheten i økonomiske analyser skyldes i særlig grad usikkerhet i det medisinske beslutningsgrunnlag

  • Økonomiske analyser kan fremstå som mer usikre enn kliniske beslutninger fordi usikkerheten fremheves eksplisitt

Figur 1@ og figur 2@ finnes på www.tidsskriftet.no

Anbefalte artikler