Variasjon i dødelighet mellom sykehus må tas alvorlig

Redaksjonelt
    ()

    sporsmal_grey_rgb
    Artikkel

    HELTEFs rapport er et godt utgangspunkt for studier av egen virksomhet

    Stiftelse for helsetjenesteforskning (HELTEF) lanserte i mars sin rapport om variasjon i dødelighet for fem utvalgtediagnoserelaterte grupper (DRG) ved norske sykehus (1). Som man kunne vente, har rapporten fått stor oppmerksomhet, ogdet må sies å ha vært temmelig naivt av HELTEF å tro at politikere og presse ville slå seg til ro med at det enkeltesykehus ikke ville bli eksponert. I studien forsvares anonymiteten med at datagrunnlaget er for usikkert til at dårligeresultater vil kunne rettsforfølges. Det har forfatterne helt rett i, men det er ikke noe argument for å holde tilbakeopplysninger om offentlig virksomhet. Både sykehuseiere og leger må nå innse at åpenhet om behandlingsresultater erkommet for å bli. Bristol-saken viste vei (2). Den store utfordringen er å forklare publikum de begrensninger en slikundersøkelse har, og redusere frykten mange vil føle overfor innleggelse i sykehus med relativt dårligere resultaterenn andre. Det er klart folk blir forvirret når forskjellen i absolutt (ukorrigert for alder, kjønn mv.) dødelighet forlårhals- og lårbeinsbrudd mellom det "dårligste" og det "beste" sykehuset er på 0,04%, mens dette er fremstilt som enrelativ forskjell på 100% (3).

    Men det er også en utfordring å få sykehuseiere og leger til å ta resultatene alvorlig, og ikke feste seg ved allemulige feilkilder. Rapporten gir en klar redegjørelse for metodesvakheter, og seks vesentlige forklaringer på den storevariasjonen i dødelighet diskuteres.

    For det første er det ikke kontrollert for ulik sykelighet i sykehusenes nedslagsfelt. Man kan f.eks. tenke seg atbefolkningen i Sogn og Fjordane generelt er så mye sterkere enn andre at de bedre tåler et hjerteinfarkt. En muligforklaring på at større sykehus generelt kommer noe dårlig ut kan være at de sykeste pasientene ikke legges inn ilokalsykehus. En tredje feilkilde kan være at man har ulike terskler for sykehusinnleggelse i ulike deler av landet.Dette gjelder nok især pasienter med hjertesvikt, lungebetennelse eller pleuritt, i mindre grad dem med hjerteinfarktog lårhals- eller lårbeinsbrudd. Videre kan ulik prehospital dødelighet betinget i distanse til sykehus og kvalitet påtransporttjenesten være en feilkilde, likeså mulige forskjeller i diagnoseklassifiseringen.

    Når så mange sammenlikninger gjøres som i denne rapporten, må dessuten tilfeldig variasjon forventes. Selv ved enrandomisering av innleggelsene til 60 helt like sykehus ville man vente signifikant avvikende resultater for tresykehus per diagnose man studerer.

    Men antallet avvik i HELTEFs undersøkelse var fem ganger større enn dette, og kan ikke forklares med tilfeldigheteralene. Derimot burde kanskje Bonferroni-korreksjon vært anvendt for å korrigere for antall gjennomførte analyser.Forfatterne begrunner fraværet av denne korreksjonen med at 95% konfidensintervall for resultatene allerederepresenterer en meget stor feilmargin med lav sensitivitet for å identifisere sykehus med avvik. Fra etpasientsynspunkt er så lav sensitivitet neppe ønskelig, hevder de, og man valgte derfor pragmatisk en presentasjon avenkeltresultater uten korreksjon. Dette skjønn kan diskuteres. Hvis datagrunnlaget er svært usikkert, bør margineneantakelig være store.

    Studien søker også etter mulig samvariasjon mellom sykehusets aktivitetsnivå og dødelighet, uten å kunne påviseoverbevisende sammenhenger. Denne analysen bygger på en teoretisk modell som presenteres altfor kortfattet i rapporten.Analysene dokumenteres med spredningsdiagram med regresjonslinje. Bruken av en slik linje er ofte misvisende og børunngås i korrelasjonsanalyser (4).

    Rangering av behandlingsresultater basert på registerdata er beheftet med stor usikkerhet (5). Forfatterne underslårikke dette. De redegjør for at rapporten først og fremst må brukes av det enkelte sykehus for å stille spørsmål vedegen virksomhet. Rådet er at dersom man kommer dårlig ut for en av diagnosegruppene, bør dette føre til en analyse avhva som kan være forklaringen. Det kan godt være at årsaken er forhold sykehuset selv ikke er herre over, men det erikke et svar man kan slå seg til ro med uten en grundig vurdering. Og skulle årsaken være avvikendediagnoseklassifisering, og ikke et reelt dårligere behandlingsresultat, burde også det føre til endring. Alle er tjentmed at oppbyggingen av databaser gjøres med så lite variasjon i kvaliteten på dataene som legges inn, at det er mulig ågjøre reelle sammenlikninger, ikke minst over tid.

    Analysene bygger på dødsfall under sykehusoppholdet. Forfatterne anbefaler at man registrerer dødsfall inntil 30dager, ev. også 90 dager, etter utskrivning. De frykter at noen vil ønske å manipulere sine resultater ved å skrive utdøende pasienter, og derved forhindre at dødsfallene vil bli registrert i analyser som den foreliggende. Så absurd enslik tanke enn måtte synes, kan vi dessverre ikke se bort fra slike konsekvenser. Datamanipulasjon forekommer ikjølvannet av at dødelighetsdata publiseres (6).

    Denne type rapporter vil vi komme til å se flere av. De representerer et viktig verktøy for kvalitetsforbedring ihelsevesenet, men det er nødvendig å understreke at de absolutte forskjeller i dødelighet mellom sykehusene ikke erdramatiske. Trolig reflekterer resultatene vel så mye feilkildene som reelt store forskjeller i behandlingskvalitet.Likevel er det ikke gunstig at man, ved å ta rapporten "med stor ro" eller betvile undersøkelsens kvalitet, girpublikum et signal om at man er tilfreds. Selv om denne reaksjonen kan være en konsekvens av innsikt i undersøkelsenssvakheter, er det ikke slik man vil bli oppfattet i befolkningen. Helsevesenets holdning må være offensiv: Dissetallene vil vi studere nøye!

    Pål Gulbrandsen

    Pål Gulbrandsen (f. 1955) er medisinsk redaktør i Tidsskriftet.

    PDF
    Skriv ut

    Anbefalte artikler

    Laget av Ramsalt med Ramsalt Media