Hundre år med det randomiserte forsøk

Redaksjonelt
    ()

    sporsmal_grey_rgb
    Artikkel

    Sammenliknende erfaring er en absolutt betingelse for den eksperimentelle og vitenskapelige medisin,
    ellers vandrer legen på måfå og blir offer for tusen illusjoner.

    Claude Bernard (1)

    Det eldste kontrollerte kliniske forsøk vi kjenner i medisinen er datert 1898. Den danske legen Johannes Fibigervurderte effekten av serumbehandling ved difteri (2). Pasienter som ble innlagt den ene dagen, fikk serumbehandling,mens de som ble innlagt neste dag ikke fikk noen behandling. Forsøket, som varte et helt år, omfattet 484 pasienter somble innlagt ved Blegdamshospitalet med difteri. Åtte pasienter døde i behandlingsgruppen mot 30 i den like storekontrollgruppen.

    Interessen for å bruke den eksperimentelle design i medisinsk forskning også utenfor laboratoriet våknet imidlertidførst for alvor etter den annen verdenskrig. I 1948 presenterte The UK Medical Research Council resultatene avstreptomycinbehandling ved tuberkulose bedømt ved hjelp av et randomisert forsøk (3). "Its importance cannot beexaggerated. It opened up a new world of evaluation and control which will, I think, be the key to a rational healthservice," skrev epidemiologen Archie Cochrane (1909-88) senere om streptomycinforsøket (4). Den britiske statistikerenAustin Bradford Hill (1897-1991) må tilskrives mye av æren for de systematiske bestrebelsene på å etablere påliteligekontrollgrupper i vurderingen av medisinske behandlingsformer. Han var influert av Ronald A. Fischers arbeider i1920-årene. Fischer (1890-1962), som arbeidet med landbruksforskning, introduserte eksperimentet som evalueringsform,oppfant variansanalysen og var antakelig den første som brukte uttrykket randomisering (5).

    Hvorfor vurdere effekten av medisinske handlinger?

    På godt og vondt er legeyrket handlingsorientert; leger vil gjerne "gjøre noe" for sine pasienter. Forsøkene på åsvare på "Hva kan vi gjøre med det?" utgjør derfor en stor del av kunnskapsvolumet i praktisk medisin.

    Når vi griper inn for å påvirke det naturlige forløp av ulike helseplager, er det viktig å være sikker på at vi gjørmer nytte enn skade. Av og til er virkningen så åpenbar og dramatisk at erfaring basert på noen få observasjoner ertilstrekkelig som begrunnelse. Hvis vi ikke får stoppet alvorlige blødninger, dør pasientene. Antibiotika ved meningittredder liv.

    Erfaring er imidlertid en dårlig veiviser når effektene er moderate eller små. Hvis noe hjelper én av ti eller én av300, er det ikke lett å skille ut effekten av tiltaket fra den naturlige biologiske variasjon og de tilfeldigheter sompåvirker alt en pasient kan feile. Ikke sjelden står mye på spill. I 1981 publiserte Horwitz & Feinstein enpasient-kontroll-studie som tydet på at profylakse med lidokain normaliserte arytmier og reduserte dødeligheten etterhjerteinfarkt (6). Lidokain var allerede i utstrakt bruk for denne indikasjonen. Det tok ti år før ekspertene lot segoverbevise om at denne terapiformen faktisk tar flere liv enn den redder (7, 8). Effekten er i samme størrelsesordensom den positive virkningen av acetylsalisylsyre og streptokinase ved akutt hjerteinfarkt. På 1980-tallet døde årligtrolig 20000-70000 pasienter med hjerteinfarkt pga. behandling med lidokain i USA (7).

    Det er først og sist det uetiske ved å utsette pasienter for fare pga. intervensjoner med ukjent effekt som diktererbehovet for pålitelige vurderinger av det vi gjør. Det gjelder enten tiltaket brukes for å forebygge eller behandle,enten "inngrepet" er teknisk eller består i en mellommenneskelig handling. Når alt kommer til alt, er alle forsøk på åbedømme hva som virker, en gjetning vedrørende sannheten. Det er et faglig og etisk imperativ å gjøre eksplisitthvilket logisk og empirisk grunnlag gjetningen hviler på (9).

    Hva er poenget med randomisering?

    Tilfeldig fordeling av personer til henholdsvis intervensjon eller kontroll er viktig av en eneste grunn; det er deneneste effektive måte å sikre sammenliknbarhet mht. prognose og respons på behandlingen. Ingen annen måte å etablere etsammenlikningsgrunnlag på sikrer at kjente (og derfor ofte målbare) og ukjente (ikke-målbare) forhold som virker inn påutfallet, er om lag likt fordelt mellom gruppene (10).

    Randomisering er altså et forsøk på å minimalisere seleksjonsskjevhet. Denne design løser ikke problemer som kanoppstå etter etableringen av de grupper som skal sammenliknes; f.eks. systematiske ulikheter i annen behandling somtilbys (utover den som skal vurderes) eller skjevheter i hvordan utfallene blir målt.

    Hvordan randomiseringen skjer, er viktig. Det var Thomas Chalmers (1917-95) og medarbeidere som først viste at detikke å skjule prosedyren for fordeling til intervensjon eller kontroll for dem som rekrutterer pasientene (concealmentof allocation), ofte resulterer i en skjevfordeling av prognostiske faktorer og derfor gir effektestimater som erforskjellige fra (og oftere statistisk signifikante) enn de estimater man får når allokeringsprosedyren er skjult (11).Denne feilkilden alene kan ha større effekt enn den vi håper behandlingen har (12).

    Striden om ikke-randomisert effektforskning

    Ikke alle deler synet på at randomisering er avgjørende for pålitelige effektvurderinger (13, 14). Kritikerne harflere viktige innvendinger. Systematiske oversikter, bl.a. dem som lages av The Cochrane Collaboration (15), viser aten rekke randomiserte forsøk er dårlig planlagt og gjennomført. I mange undersøkelser har man unnlatt å besvarespørsmål og måle utfall som er viktige for pasientene. Av de skammelig få forsøk som finnes i verden om effekt avschizofrenibehandling, har halvparten en oppfølgingstid på seks uker eller kortere (16). Og et randomisert forsøk kanbare klargjøre at et tiltak har (eller ikke har) effekt. Andre metoder, bl.a. kvalitative design oglaboratorieforskning, må brukes for å forklare hvorfor og hvordan noe virker.

    Det er også innlysende at spørsmålet må avgjøre hvordan man bør gå frem for å finne svaret. Hvis man lurer på hvainnvandrerkvinner tenker om prevensjon, vil ikke et randomisert forsøk gi svaret. Hvis spørsmålet er om staten bør eiesykehusene, er randomisering en praktisk umulighet. Er man på jakt etter sjeldne bivirkninger, må man lete med andredesigner.

    Det er imidlertid en heftig uenighet i medisinen for tiden om hvorvidt man kan nøye seg med ikke-randomiserteeffektvurderinger for å svare på spørsmål som kunne belyses med en randomisert design, men der det enten ikke er gjorteller ikke er gjort godt nok. Etter min vurdering skyldes dette at mange leger og andre handlingsorienterte faggrupperhar en overdreven tro på effektene av det de driver med og ikke erkjenner klart nok at systematiske feil kan lede tilinnføring av uvirksomme (bortkastede ressurser) eller farlige virkemidler. Inntil nylig var det f.eks. helt uklart hvasom var det beste legemiddelvalg for å kontrollere kramper ved eklampsi fordi det ikke fantes noen randomiserte forsøk.100 års uenighet skyldtes den håpløse oppgave å tolke ukontrollerte pasientmaterialer og ikke-randomisertesammenlikninger. I 1995 ble dette spørsmålet besvart overbevisende (17), men ikke før bokstavelig talt millioner avkvinner hadde betalt prisen for at ingen fagfolk hadde tatt seg sammen og organisert et tilfredsstillende forsøk.

    Forskning skal opplyse beslutninger, ikke diktere dem

    En viktig begrunnelse for å få frem gode effektvurderinger, er å kunne bli ferdig med spørsmålet om hva denmedisinske effekten er. Da er det mulig og meningsfullt å gå videre til et annet viktig spørsmål i klinisk medisin;hvordan pasienter selv vil fargelegge kunnskapsbildet med meninger, følelser og opplevelser av hvilke utfall som erviktig for dem.

    Så lenge fagfolk faktisk ikke besitter et pålitelig bilde av hva som virker og hvor sterkt det virker, eller når mantror mer på den forskning som er tilgjengelig enn det er grunnlag for, fungerer "kunnskap" tilslørende. Toneangivendekvinnelige gynekologer gav i dagspressen nylig uttrykk for at flere norske kvinner burde bruke østrogen ettermenopausen og hevdet at allmennpraktikeres tilbakeholdenhet trolig skyldtes at "de ikke er helt oppdatert påforskningsresultater" (18). Eksemplet illustrerer at diskusjonen om design er noe mer enn en akademisk øvelse. Kunnskapom effekter av østrogensubstitusjon fra kohort- og pasient-kontroll-undersøkelser tyder på en positiv effekt på hjerte-og karsykdom (ett unngått tilfelle av hjertesykdom per 50 behandlede etter ti år) og en viss økning i forekomsten avbrystkreft (ett tilfelle per 100 behandlede etter 15 år) (19, 20). Ikke bare er dette moderate effekter (som knaptkaller på sterke anbefalinger), det er også upålitelige estimater (21).

    Kunnskap er makt og bør deles med andre. Upålitelig kunnskap vanskeliggjør en nødvendig demokratisering avmedisinen, der publikum blir en mer aktiv deltaker i medisinske beslutninger (22). Derfor har uenigheten om hva som erpålitelig kunnskap om effekt av helsetjenester, viktige implikasjoner for relasjonen mellom lege og pasient ogforholdet mellom fag og politikk.

    Arild Bjørndal

    PDF
    Skriv ut

    Anbefalte artikler

    Laget av Ramsalt med Ramsalt Media