Hundre år med det randomiserte forsøk

A Bjørndal

Redaksjonelt

Hundre år med det randomiserte forsøk

A Bjørndal

Se alle artikler

Bjørndal A

Artikkel

Sammenliknende erfaring er en absolutt betingelse for den eksperimentelle og vitenskapelige medisin,
ellers vandrer legen på måfå og blir offer for tusen illusjoner.
Claude Bernard (1)

Det eldste kontrollerte kliniske forsøk vi kjenner i medisinen er datert 1898. Den danske legen Johannes Fibigervurderte effekten av serumbehandling ved difteri (2). Pasienter som ble innlagt den ene dagen, fikk serumbehandling,mens de som ble innlagt neste dag ikke fikk noen behandling. Forsøket, som varte et helt år, omfattet 484 pasienter somble innlagt ved Blegdamshospitalet med difteri. Åtte pasienter døde i behandlingsgruppen mot 30 i den like storekontrollgruppen.

Interessen for å bruke den eksperimentelle design i medisinsk forskning også utenfor laboratoriet våknet imidlertidførst for alvor etter den annen verdenskrig. I 1948 presenterte The UK Medical Research Council resultatene avstreptomycinbehandling ved tuberkulose bedømt ved hjelp av et randomisert forsøk (3). "Its importance cannot beexaggerated. It opened up a new world of evaluation and control which will, I think, be the key to a rational healthservice," skrev epidemiologen Archie Cochrane (1909-88) senere om streptomycinforsøket (4). Den britiske statistikerenAustin Bradford Hill (1897-1991) må tilskrives mye av æren for de systematiske bestrebelsene på å etablere påliteligekontrollgrupper i vurderingen av medisinske behandlingsformer. Han var influert av Ronald A. Fischers arbeider i1920-årene. Fischer (1890-1962), som arbeidet med landbruksforskning, introduserte eksperimentet som evalueringsform,oppfant variansanalysen og var antakelig den første som brukte uttrykket randomisering (5).

Hvorfor vurdere effekten av medisinske handlinger?

På godt og vondt er legeyrket handlingsorientert; leger vil gjerne "gjøre noe" for sine pasienter. Forsøkene på åsvare på "Hva kan vi gjøre med det?" utgjør derfor en stor del av kunnskapsvolumet i praktisk medisin.

Når vi griper inn for å påvirke det naturlige forløp av ulike helseplager, er det viktig å være sikker på at vi gjørmer nytte enn skade. Av og til er virkningen så åpenbar og dramatisk at erfaring basert på noen få observasjoner ertilstrekkelig som begrunnelse. Hvis vi ikke får stoppet alvorlige blødninger, dør pasientene. Antibiotika ved meningittredder liv.

Erfaring er imidlertid en dårlig veiviser når effektene er moderate eller små. Hvis noe hjelper én av ti eller én av300, er det ikke lett å skille ut effekten av tiltaket fra den naturlige biologiske variasjon og de tilfeldigheter sompåvirker alt en pasient kan feile. Ikke sjelden står mye på spill. I 1981 publiserte Horwitz & Feinstein enpasient-kontroll-studie som tydet på at profylakse med lidokain normaliserte arytmier og reduserte dødeligheten etterhjerteinfarkt (6). Lidokain var allerede i utstrakt bruk for denne indikasjonen. Det tok ti år før ekspertene lot segoverbevise om at denne terapiformen faktisk tar flere liv enn den redder (7, 8). Effekten er i samme størrelsesordensom den positive virkningen av acetylsalisylsyre og streptokinase ved akutt hjerteinfarkt. På 1980-tallet døde årligtrolig 20000-70000 pasienter med hjerteinfarkt pga. behandling med lidokain i USA (7).

Det er først og sist det uetiske ved å utsette pasienter for fare pga. intervensjoner med ukjent effekt som diktererbehovet for pålitelige vurderinger av det vi gjør. Det gjelder enten tiltaket brukes for å forebygge eller behandle,enten "inngrepet" er teknisk eller består i en mellommenneskelig handling. Når alt kommer til alt, er alle forsøk på åbedømme hva som virker, en gjetning vedrørende sannheten. Det er et faglig og etisk imperativ å gjøre eksplisitthvilket logisk og empirisk grunnlag gjetningen hviler på (9).

Hva er poenget med randomisering?

Tilfeldig fordeling av personer til henholdsvis intervensjon eller kontroll er viktig av en eneste grunn; det er deneneste effektive måte å sikre sammenliknbarhet mht. prognose og respons på behandlingen. Ingen annen måte å etablere etsammenlikningsgrunnlag på sikrer at kjente (og derfor ofte målbare) og ukjente (ikke-målbare) forhold som virker inn påutfallet, er om lag likt fordelt mellom gruppene (10).

Randomisering er altså et forsøk på å minimalisere seleksjonsskjevhet. Denne design løser ikke problemer som kanoppstå etter etableringen av de grupper som skal sammenliknes; f.eks. systematiske ulikheter i annen behandling somtilbys (utover den som skal vurderes) eller skjevheter i hvordan utfallene blir målt.

Hvordan randomiseringen skjer, er viktig. Det var Thomas Chalmers (1917-95) og medarbeidere som først viste at detikke å skjule prosedyren for fordeling til intervensjon eller kontroll for dem som rekrutterer pasientene (concealmentof allocation), ofte resulterer i en skjevfordeling av prognostiske faktorer og derfor gir effektestimater som erforskjellige fra (og oftere statistisk signifikante) enn de estimater man får når allokeringsprosedyren er skjult (11).Denne feilkilden alene kan ha større effekt enn den vi håper behandlingen har (12).

Striden om ikke-randomisert effektforskning

Ikke alle deler synet på at randomisering er avgjørende for pålitelige effektvurderinger (13, 14). Kritikerne harflere viktige innvendinger. Systematiske oversikter, bl.a. dem som lages av The Cochrane Collaboration (15), viser aten rekke randomiserte forsøk er dårlig planlagt og gjennomført. I mange undersøkelser har man unnlatt å besvarespørsmål og måle utfall som er viktige for pasientene. Av de skammelig få forsøk som finnes i verden om effekt avschizofrenibehandling, har halvparten en oppfølgingstid på seks uker eller kortere (16). Og et randomisert forsøk kanbare klargjøre at et tiltak har (eller ikke har) effekt. Andre metoder, bl.a. kvalitative design oglaboratorieforskning, må brukes for å forklare hvorfor og hvordan noe virker.

Det er også innlysende at spørsmålet må avgjøre hvordan man bør gå frem for å finne svaret. Hvis man lurer på hvainnvandrerkvinner tenker om prevensjon, vil ikke et randomisert forsøk gi svaret. Hvis spørsmålet er om staten bør eiesykehusene, er randomisering en praktisk umulighet. Er man på jakt etter sjeldne bivirkninger, må man lete med andredesigner.

Det er imidlertid en heftig uenighet i medisinen for tiden om hvorvidt man kan nøye seg med ikke-randomiserteeffektvurderinger for å svare på spørsmål som kunne belyses med en randomisert design, men der det enten ikke er gjorteller ikke er gjort godt nok. Etter min vurdering skyldes dette at mange leger og andre handlingsorienterte faggrupperhar en overdreven tro på effektene av det de driver med og ikke erkjenner klart nok at systematiske feil kan lede tilinnføring av uvirksomme (bortkastede ressurser) eller farlige virkemidler. Inntil nylig var det f.eks. helt uklart hvasom var det beste legemiddelvalg for å kontrollere kramper ved eklampsi fordi det ikke fantes noen randomiserte forsøk.100 års uenighet skyldtes den håpløse oppgave å tolke ukontrollerte pasientmaterialer og ikke-randomisertesammenlikninger. I 1995 ble dette spørsmålet besvart overbevisende (17), men ikke før bokstavelig talt millioner avkvinner hadde betalt prisen for at ingen fagfolk hadde tatt seg sammen og organisert et tilfredsstillende forsøk.

Forskning skal opplyse beslutninger, ikke diktere dem

En viktig begrunnelse for å få frem gode effektvurderinger, er å kunne bli ferdig med spørsmålet om hva denmedisinske effekten er. Da er det mulig og meningsfullt å gå videre til et annet viktig spørsmål i klinisk medisin;hvordan pasienter selv vil fargelegge kunnskapsbildet med meninger, følelser og opplevelser av hvilke utfall som erviktig for dem.

Så lenge fagfolk faktisk ikke besitter et pålitelig bilde av hva som virker og hvor sterkt det virker, eller når mantror mer på den forskning som er tilgjengelig enn det er grunnlag for, fungerer "kunnskap" tilslørende. Toneangivendekvinnelige gynekologer gav i dagspressen nylig uttrykk for at flere norske kvinner burde bruke østrogen ettermenopausen og hevdet at allmennpraktikeres tilbakeholdenhet trolig skyldtes at "de ikke er helt oppdatert påforskningsresultater" (18). Eksemplet illustrerer at diskusjonen om design er noe mer enn en akademisk øvelse. Kunnskapom effekter av østrogensubstitusjon fra kohort- og pasient-kontroll-undersøkelser tyder på en positiv effekt på hjerte-og karsykdom (ett unngått tilfelle av hjertesykdom per 50 behandlede etter ti år) og en viss økning i forekomsten avbrystkreft (ett tilfelle per 100 behandlede etter 15 år) (19, 20). Ikke bare er dette moderate effekter (som knaptkaller på sterke anbefalinger), det er også upålitelige estimater (21).

Kunnskap er makt og bør deles med andre. Upålitelig kunnskap vanskeliggjør en nødvendig demokratisering avmedisinen, der publikum blir en mer aktiv deltaker i medisinske beslutninger (22). Derfor har uenigheten om hva som erpålitelig kunnskap om effekt av helsetjenester, viktige implikasjoner for relasjonen mellom lege og pasient ogforholdet mellom fag og politikk.

Arild Bjørndal

Litteratur

1.
Bernard CL. Introduction à l'étude de la médecine expérimentale. 1866, gjenopptrykt. London: Garnie-Flammarion, 1966.
2.
Wulff HR, Gøtzsche PC. Rationel klinik. Evidensbaserede diagnostiske og terapeutiske beslutninger. København: Munksgaard, 1997.
3.
Medical Research Council. Streptomycin treatment of pulmonary tuberculosis: a Medical Research Council investigation. BMJ 1948; 2: 769-82.
4.
Cochrane AL. Effectiveness and efficiency: random reflections on health services. London: Nuffield Provincial Hospitals Trust, 1972.
5.
Box JF, Fisher RA. The life of a scientist. New York: Wiley, 1978.
6.
Horwitz RI, Feinstein AR. Improved observational method for studying therapeutic efficacy: suggestive evidence that lidocaine prophylaxis prevents death in acute myocardial infarction. JAMA 1981; 246: 2455-9.
7.
Moore T. Deadly medicine. NewYork: Simon & Schuster, 1995.
8.
Hine LK, Laird N, Hewitt P, Chalmers TC. Meta-analytic evidence against prophylactic use of lidocaine in acute myocardial infarction. Arch Intern Med 1989; 149: 2694-8.
9.
Chalmers I. Unbiased, relevant, and reliable assessments in health care. Important progress during the past century, but plenty of scope for doing better. BMJ 1998; 317: 1167-7.
10.
Bjørndal A. Det er resultatene som teller, men hvordan skal vi telle resultatene? Tidsskr Nor Lægeforen 1994; 114: 3416-7.
11.
Chalmers TC, Celano P, Sacks HS, Smith H. Bias in treatment assignment in controlled clinical trials. N Engl J Med 1983; 309: 1358-61.
12.
Kunz R, Oxman AD. The unpredictability paradox: review of empirical comparisons of randomised and non-randomised clinical trials. BMJ 1998; 317: 1185-90.
13.
Black N. Why we need observational studies to evaluate the effectiveness of health care. BMJ 1996; 312: 1215-8.
14.
Hansen NE, Karle H. Medicinsk teknologivurdering med kommandoetik II. Ugeskr Læger 1996; 159: 69-70.
15.
Bjørndal A. Hvilke av de helsetjenester vi tilbyr, er effektive? Tidsskr Nor Lægeforen 1993; 113: 3669-70.
16.
Thornley B, Adams C. Content and quality of 2000 controlled trials in schizophrenia over 50 years. BMJ 1998; 317: 1181-4.
17.
Which anticonvulsant for women with eclampsia? Evidence from the Collaborative Eclampsia Trial. Lancet 1995; 345: 1455-63.
18.
Vatnelid LS, Hansen F. Du kan holde deg ung med hormoner. Det gjør kvinnelegene. Dagbladet 20.8.1998.
19.
Petitti DB. Hormone replacement therapy and heart disease prevention: experimentation trumps observation. JAMA 1998; 280: 650-2.
20.
Collaborative Group on Hormonal Factors in Breast Cancer. Breast cancer and hormone replacement therapy: collaborative reanalysis of data from 51 epidemiological studies of 52,705 women with breast cancer and 108,411 women without breast cancer. Lancet 1997; 350: 1047-59.
21.
Hulley S, Grady D, Bush T, Furberg C, Herrington D, Riggs B et al. Randomized trial of estrogen plus progestin for secondary prevention of coronary heart disease in postmenopausal women. JAMA 1998; 280: 605-13.
22.
Bjørndal A. Fra pasienttilfredshet til brukermedvirkning. Tidsskr Nor Lægeforen 1998; 118: 353.

Kommentarer ( 0 )

Dette kommentarfeltet modereres, men kommentarer blir ikke redaksjonelt behandlet ut over å sikre at de følger retningslinjer for vårt kommentarfelt.

Denne artikkelen ble publisert for mer enn 12 måneder siden, og vi har derfor stengt for nye kommentarer.

Publisert: 10. desember 1998

Utgave 30, 9. desember 1998

Tidsskr Nor Lægeforen 10. desember 1998

118

:

4635-6

Publisert: 10. desember 1998

Utgave 30, 9. desember 1998

Tidsskr Nor Lægeforen 1998

118

:

4635-6

PDF

Skriv ut

Hundre år med det randomiserte forsøk

Hvorfor vurdere effekten av medisinske handlinger?

Hva er poenget med randomisering?

Striden om ikke-randomisert effektforskning

Forskning skal opplyse beslutninger, ikke diktere dem

Anbefalte artikler