Følger Helsedirektoratets retningslinjer internasjonale standarder for troverdighet?
BACKGROUND
The Norwegian Directorate of Health produces national clinical guidelines for the health service, and the development of guidelines must follow international standards for trustworthy clinical practice. We investigated whether the standards are being adhered to.
MATERIAL AND METHOD
We used the National Guideline Clearinghouse Extent Adherence to Trustworthy Standards Instrument (NEATS) as the scoring tool and assessed a randomly selected chapter from national clinical guidelines that were published or updated during the period 2013 to January 2022. NEATS has 15 domain items; three are assessed with the response alternatives Yes/No/Not known, and twelve are assessed on a Likert scale from 1 to 5, where 1 corresponds to very low trustworthiness and 5 to very high trustworthiness. The assessments were made individually by two authors. Inter-rater reliability was assessed with exact or close reliability, and Cohen's kappa coefficient.
RESULTS
We included 60 relevant guidelines. For nine of the twelve NEATS domain items assessed using the Likert scale, there was very low or low adherence to standards for trustworthy clinical guidelines (median score 1 or 2). The domain items with the lowest score (median score 1) were 'The study selection', 'Description of the studies and the results', 'Rating the strength of recommendations' and 'External review'. The domain item with the highest score was 'Specific and unambiguous articulation of recommendations' (median score 4).
INTERPRETATION
The majority of the national clinical guidelines had low adherence to the standards for trustworthy clinical guidelines assessed using the NEATS scoring tool.
HOVEDFUNN
Nasjonale faglige retningslinjer hadde en median skår svarende til veldig lav til lav troverdighet for 9 av 15 domener i skåringsverktøyet NEATS.
28 av 60 av retningslinjene var innen fagfeltet onkologi, og denne gruppen hadde lavere median skår sammenliknet med retningslinjer fra andre fagfelt for syv NEATS-domener.
Retningslinjer er viktige verktøy for kunnskapsbasert praksis i helsetjenesten. I Norge er Helsedirektoratet en sentral aktør, som den eneste med lovfestet mandat til å «utvikle, formidle og vedlikeholde nasjonale faglige retningslinjer» (jf. helse- og omsorgstjenesteloven § 12 - 5 (1) og spesialisthelsetjenesteloven § 7 - 3 (2)).
Nasjonale faglige retningslinjer er normerende (3, 4). De er ikke rettslig bindende, men blir ifølge Helsedirektoratet ansett som en standard for «god faglig praksis» av nasjonale helsemyndigheter (4). Å fravike anbefalingene kan kreve en særskilt begrunnelse dokumentert i journalen (pasientjournalforskriften § 6 g) (3, 5). Det er derfor viktig at nasjonale faglige retningslinjer til enhver tid er troverdige ved å holde høy metodisk kvalitet.
Både internasjonalt og nasjonalt har det i flere tiår pågått et utstrakt arbeid med metodologiske krav til retningslinjer (6–9). I 2011 publiserte National Academy of Medicine i USA åtte standarder for utvikling av troverdige retningslinjer, som i dag er internasjonalt anerkjent (10, 11). Standardene er inkorporert i Helsedirektoratets veileder for utvikling av kunnskapsbaserte retningslinjer, som ble innført som et rammeverk for utvikling av nasjonale faglige retningslinjer i 2012 (se tabell A1 i appendiks) (3). Noen sentrale elementer er at retningslinjer er basert på oppdaterte systematiske kunnskapsoppsummeringer, at de utarbeides av multidisiplinære arbeidsgrupper, og at deltakere i arbeidsgruppen erklærer potensielle interessekonflikter (10, 11).
Vi kjenner ikke til at det er gjort noen systematisk gjennomgang av den metodiske kvaliteten til de nasjonale faglige retningslinjene, og vi ønsket derfor å undersøke i hvilken grad de oppfyller standardene for troverdige retningslinjer (10).
Materiale og metode
Utvelgelse av retningslinjer og kapitler
Vi identifiserte alle nasjonale faglige retningslinjer per 31.1.2022 og inkluderte alle med anbefalinger relatert til forebygging, diagnostikk, behandling eller rehabilitering publisert eller oppdatert i perioden 1.1.2013–31.1.2022 (12). Vi ekskluderte retningslinjer med rent organisatorisk innhold og der en ny versjon forelå som høringsutkast per 31.1.2022 (se appendiks tabell A2 og A3).
Retningslinjen Forebygging og behandling av underernæring ble oppdatert i mars 2022. Den tidligere versjonen ble borte fra Helsedirektoratets nettside i tidsrommet mellom utvelgelse for inklusjon og vår kvalitetsvurdering, og vi vurderte derfor den nyeste versjonen (13).
Vi fokuserte vurderingen på ett kapittel per inkluderte retningslinje (se appendiks tabell A3). Vi listet opp alle relevante kapitler og gjorde et tilfeldig uttrekk ved bruk av RAND-funksjonen i Microsoft Excel.
Retningslinjen Gravide i legemiddelassistert rehabilitering ble publisert i 2011. Ett kapittel ble imidlertid oppdatert i 2019, og vi har i vår gjennomgang inkludert dette kapittelet (14).
Skåringsverktøy
Vi benyttet National Guideline Clearinghouse Extent Adherence to Trustworthy Standards Instrument (NEATS) for vurdering av metodisk kvalitet (15). I NEATS skårer man overholdelse av standarder for troverdige retningslinjer, og verktøyet er kategorisert i 15 domener (10, 15) (ramme 1).
Vi brukte det engelske skåringsverktøyet ved vurdering av retningslinjene (15). Den norske oversettelsen av navn på domenene (domenenummer i parentes) er gjort av forfatterne for å gjøre informasjonen lettere tilgjengelig for leseren.
Tre domener vurderes med svaralternativene Ja/Nei/Ukjent:
Finansieringskilder (1)
Tverrfaglighet i arbeidsgruppen (3a)
Metodologisk ekspertise i arbeidsgruppen (3b)
Tolv domener vurderes med poeng på en Likert-skala fra 1 til 5, der 1 reflekterer den laveste graden av overholdelse av standarder for troverdige retningslinjer og 5 reflekterer den høyeste graden av overholdelse (1 – svært lav; 2 – lav; 3 – god; 4 – meget god; 5 – utmerket):
Rapportering og håndtering av interessekonflikter (2)
Pasient- og brukerperspektiv (4)
Søkestrategi (5a)
Studieseleksjon (5b)
Beskrivelse av studiene og resultatene (5c)
Gradering av tillit til resultatene (6)
Redegjørelse for fordeler og ulemper ved anbefalingene (7)
Redegjørelse for kunnskapen som støtter anbefalingene (8)
Gradering av styrken til anbefalingene (9)
Spesifikk og utvetydig formulering av anbefalingene (10)
Ekstern høring (11)
Oppdatering (12)
De to studentforfatterne (EAL og SERP) som skulle skåre retningslinjene, var ikke kjent med NEATS fra før og trente på bruk av skåringsverktøyet i en periode på to uker, veiledet av en tredje forfatter (LMH). De leste standardene for utvikling av troverdige retningslinjer (10, 11) og artikkelen som beskriver skåringsverktøyet (15). EAL, SERP og LMH gjennomgikk NEATS-domenene ved bruk av ECRI Guidelines Trust – TRUST Scorecard Analytics, som inkluderer eksempler på grunner til å oppgradere eller nedgradere et domene (16). EAL og SERP gikk deretter gjennom tre tilfeldig utvalgte retningslinjer og skåret dem individuelt, før de sammen med LMH gjennomgikk skåringene, diskuterte uenigheter og kalibrerte vurderingene mot hverandre.
Vurdering av retningslinjene
EAL og SERP gjorde en uavhengig vurdering av alle NEATS-domenene for inkluderte retningslinjer basert på de utvalgte retningslinjekapitlene, metodebeskrivelser/metodekapitler samt henvisninger til nettbaserte ressurser eller annen dokumentasjon oppgitt i retningslinjene (12).
Diskrepans mellom de to uavhengige vurderingene ble løst ved konsensus, noen ganger med hjelp av en tredjeperson (LMH). Uavhengige vurderinger og konsensusvurderinger ble registrert i Microsoft Excel.
Rapportering av resultater og statistiske analyser
Vi rapporterer konsensusvurderinger for alle NEATS-domenene. For de tre domenene vurdert med svaralternativene ja/nei/ukjent beregnet vi prosentandel for ulike svaralternativer. For de tolv domenene vurdert med Likert-skala fra 1 til 5 beregnet vi median og interkvartilbredde for alle retningslinjene samlet samt stratifisert for fagfelt (onkologi versus ikke-onkologi).
For uavhengige vurderinger angir vi eksakt samsvar, nært samsvar (andel innenfor +/− 1) og vektet Cohens kappa (17). Ved beregning av Cohens kappa brukte vi lineær vekting basert på graden av uenighet på Likert-skalaen, slik at et større avvik (f.eks. skår 2 versus 5) ble tillagt mer vekt enn et mindre avvik (f.eks. 2 versus 3). Statistiske analyser ble utført med Stata, versjon 17.0 (StataCorp LLC, TX, USA).
Resultater
Vi identifiserte 66 nasjonale faglige retningslinjer i studieperioden, hvorav seks ble ekskludert (to fordi en nyere utgave var publisert som høringsutkast, fire fordi de hadde et rent organisatorisk innhold) (se appendiks tabell A2).
Vi inkluderte 60 retningslinjer for vurdering med NEATS, hvorav ingen inneholdt informasjon om finansieringskilde, 57 var utviklet av tverrfaglige arbeidsgrupper og 15 inkluderte personer med metodeekspertise i arbeidsgruppen (27 inkluderte ikke metodeekspertise, og for 18 var det ukjent).
For domenene vurdert med Likert-skala var det lav til veldig lav overholdelse av standarder for troverdige retningslinjer for ni av tolv domener (median skår 1 eller 2) (tabell 1) (se appendiks tabell A4). Figur 1 viser fordelingen av skår 1 til 5 per domene. «Spesifikk og utvetydig formulering av anbefalingene» var domenet med høyest median skår (skår 4; interkvartilbredde 3 til 5) (se appendiks tabell A4).
Tabell 1
Median konsensusskår per NEATS-domene skåret med Likert-skala fra 1 til 5 for 60 nasjonale faglige retningslinjer. NEATS-domener og vurderingskriterier per domene er beskrevet i detalj hos Jue og medarbeidere (15).
NEATS-domene (domenenummer) | Median skår |
---|---|
Rapportering og håndtering av interessekonflikter (2) | 2 |
Pasient- og brukerperspektiv (4) | 2 |
Søkestrategi (5a) | 2 |
Studieseleksjon (5b) | 1 |
Beskrivelse av studiene og resultatene (5c) | 1 |
Gradering av tillit til resultatene (6) | 2,5 |
Redegjørelse for fordeler og ulemper ved anbefalingene (7) | 2 |
Redegjørelse for kunnskapen som støtter anbefalingene (8) | 3 |
Gradering av styrken på anbefalingene (9) | 1 |
Spesifikk og utvetydig formulering av anbefalingene (10) | 4 |
Ekstern høring (11) | 1 |
Oppdatering (12) | 2 |

Vurdering per fagfelt
De inkluderte retningslinjene omhandler et bredt spekter av fagfelt, med én til fire retningslinjer innen hvert fagfelt. Onkologi utpeker seg med 28 retningslinjer (se appendiks tabell A3). Median skår for retningslinjene innenfor onkologi var lavere enn for de ikke-onkologiske for syv av tolv domener skåret med Likert-skala (tabell 2) (se appendiks tabell A4).
Tabell 2
Median konsensusskår per NEATS-domene skåret med Likert-skala fra 1 til 5 for nasjonale faglige retningslinjer innen onkologi sammenliknet med ikke-onkologiske retningslinjer (domenet med lavest skår er markert i fet skrift). NEATS-domener og vurderingskriterier per domene er beskrevet i detalj hos Jue og medarbeidere (15).
NEATS-domene (domenenummer) | Median skår | |
---|---|---|
Onkologi | Ikke onkologi | |
Rapportering og håndtering av interessekonflikter (2) | 2 | 2 |
Pasient- og brukerperspektiv (4) | 2 | 3 |
Søkestrategi (5a) | 2 | 2 |
Studieseleksjon (5b) | 1 | 2 |
Beskrivelse av studiene og resultatene (5c) | 1 | 1 |
Gradering av tillit til resultatene (6) | 1 | 3 |
Redegjørelse for fordeler og ulemper ved anbefalingene (7) | 2 | 2 |
Redegjørelse for kunnskapen som støtter anbefalingene (8) | 2 | 4 |
Gradering av styrken på anbefalingene (9) | 1 | 4 |
Spesifikk og utvetydig formulering av anbefalingene (10) | 3 | 5 |
Ekstern høring (11) | 1 | 2 |
Oppdatering (12) | 4 | 1 |
Samsvar i uavhengige vurderinger
For de uavhengige vurderingene var det 100 % samsvar for domenet «finansieringskilder», 93,3 % for «tverrfaglighet i arbeidsgruppen» og 85,8 % for «metodologisk ekspertise i arbeidsgruppen».
For domenene skåret med Likert-skala var overordnet eksakt samsvar 66 %, med en vektet Cohens kappa på 0,71. Grad av samsvar varierte for de ulike domenene (fra 41,7 % til 96,7 % for eksakt samsvar, og 83,3 % til 100 % for nært samsvar) (tabell 3). Punktestimatet for vektet Cohens kappa var over 0,60 for ti av tolv domener.
Tabell 3
Grad av samsvar mellom uavhengige vurderinger av hvert NEATS-domene skåret med Likert-skala fra 1 til 5 for totalt 60 nasjonale faglige retningslinjer. NEATS-domener og vurderingskriterier per domene er beskrevet i detalj hos Jue og medarbeidere (15).
NEATS-domene (domenenummer) | Eksakt samsvar (antall) | Nært samsvar (antall)1 | Cohens kappa (vektet) |
---|---|---|---|
Rapportering og håndtering av interessekonflikter (2) | 58 | 60 | 0,94 |
Pasient- og brukerperspektiv (4) | 40 | 60 | 0,66 |
Søkestrategi (5a) | 44 | 59 | 0,69 |
Studieseleksjon (5b) | 47 | 59 | 0,74 |
Beskrivelse av studiene og resultatene (5c) | 51 | 58 | 0,78 |
Gradering av tillit til resultatene (6) | 30 | 53 | 0,61 |
Redegjørelse for fordeler og ulemper ved anbefalingene (7) | 27 | 50 | 0,51 |
Redegjørelse for kunnskapen som støtter anbefalingene (8) | 30 | 53 | 0,61 |
Gradering av styrken på anbefalingene (9) | 39 | 55 | 0,75 |
Spesifikk og utvetydig formulering av anbefalingene (10) | 25 | 50 | 0,38 |
Ekstern høring (11) | 44 | 58 | 0,68 |
Oppdatering (12) | 38 | 58 | 0,70 |
1Med nært samsvar menes skåringer som var innenfor +/− 1 mellom de to uavhengige vurderingene.
Diskusjon
Denne studien gir et bilde av i hvilken grad Helsedirektoratets nasjonale faglige retningslinjer overholder standarder for troverdige retningslinjer, vurdert med skåringsverktøyet NEATS (10, 15). Median skår for de fleste vurderte domener var 1–2, som svarer til en svært lav til lav overholdelse av standardene.
Ingen av retningslinjene inkluderte informasjon om finansieringskilde. Opplysninger om finansieringskilder er del av standardene for troverdige retningslinjer, men er ikke nevnt i Helsedirektoratets veileder (3). Således er det ikke så rart at denne informasjonen mangler (se appendiks tabell A1).
Nesten halvparten av retningslinjene (28 av 60) var innen onkologi. Sammenliknet med retningslinjer fra andre fagfelt hadde de onkologiske en lavere median skår for syv av tolv domener skåret med Likert-skala. Årsaken til dette er ukjent (tabell 2) (se appendiks tabell A4). Helsedirektoratet er tydelig på at alle nasjonale faglige retningslinjer bør følge samme metoder når de utvikles (3). Derfor gir vi i hovedsak en samlet rapportering av resultatene, uavhengig av fagfelt. Fordi de onkologiske retningslinjene utgjør en stor andel av alle inkluderte retningslinjer, påvirkes imidlertid median skår for mange domener i den samlete rapporteringen (tabell 1, tabell 2) (se appendiks tabell A4).
Styrker og begrensninger
Vi har vurdert alle nasjonale faglige retningslinjer publisert eller oppdatert i perioden 2013–22, og vår studie gir et oppdatert bilde av den metodiske kvaliteten til disse produktene. Vi kjenner ikke til at det tidligere er gjort noen tilsvarende studie i Norge.
De nasjonale faglige retningslinjene inneholder ofte mange kapitler som kan være utarbeidet av ulike arbeidsgrupper og ha ulik dato for publikasjon/oppdatering. I noen tilfeller kan de også ha brukt ulike metoder i utarbeidingen av anbefalinger (12). Vi vurderte derfor at vi ikke med sikkerhet kunne gi én felles skår for hele retningslinjen uten å vurdere den metodiske kvaliteten i hvert kapittel for seg. Å vurdere hvert kapittel for seg var imidlertid for ressurskrevende, og vi valgte derfor å basere vår gjennomgang på ett tilfeldig utvalgt kapittel per retningslinje. Den tilfeldige trekningen av kapitlene skulle redusere faren for skjevhet i utvalget. De fleste nasjonale faglige retningslinjer har brukt samme metoder for å utarbeide ulike kapitler, gjenspeilet i ett felles metodekapittel for hele retningslinjen, men fordi vår vurdering var fokusert på ett kapittel kan vi ikke med sikkerhet si at skåringene er representative for retningslinjen som helhet.
Våre vurderinger er basert på det som er rapportert i det utvalgte kapittelet med tilhørende metodedel (12). Vi har ikke tatt kontakt med Helsedirektoratet eller representanter for arbeidsgruppene for å få tilgang på annet materiale. Vi mener det er rimelig å vurdere metodisk kvalitet basert på det som er tilgjengeliggjort, som er det samme grunnlaget brukere av retningslinjene har når de skal vurdere retningslinjenes troverdighet.
Det finnes ulike verktøy for å vurdere kvaliteten på retningslinjer (18–23), det mest brukte er The Appraisal of Guidelines for Research and Evaluation II tool (AGREE II) (23). AGREE II omhandler imidlertid ikke standardene for troverdige retningslinjer direkte (10). Vi brukte skåringsverktøyet NEATS fordi det er eksplisitt utviklet for å vurdere standardene for troverdige retningslinjer og er enklere og raskere å bruke enn AGREE II (15). De fleste domener i NEATS er modifikasjoner av elementer fra AGREE II, og det er derfor sannsynlig at en retningslinje som skårer lavt ved bruk av NEATS, også vil gjøre det ved bruk av AGREE II (15, 23).
To forfattere gjorde en uavhengig vurdering før de sammenliknet svarene og kom frem til konsensus. Det at kun to forfattere vurderte retningslinjene, kan gi en risiko for at vurderingene er strengere eller mindre strenge enn om flere personer hadde vært involvert i vurderingsarbeidet eller vurderingene hadde blitt kalibrert i et større team.
Overordnet samsvar for de uavhengige vurderingene var høy og tilsvarende det man fant ved utviklingen og testingen av skåringsverktøyet (15). To av domenene hadde et spesielt dårlig samsvar, «redegjørelse for fordeler og ulemper ved anbefalingene» og «spesifikk og utvetydig formulering av anbefalingene». Den ene forfatteren var strengere i sin vurdering av disse domenene enn den andre, men dette ble diskutert og justert for i konsensusprosessen, og vi mener at våre resultater basert på konsensussvar er rimelige også for disse domenene.
Vi har ikke vurdert kvaliteten på selve anbefalingene i de inkluderte retningslinjene. En slik vurdering krever at hele retningslinjearbeidet blir gjort på ny med standarder vi beskriver her (10, 11). Det er viktig å påpeke at selv om en retningslinje i liten grad overholder standarder for troverdige retningslinjer, kan den likevel gi gode anbefalinger for klinisk praksis.
Implikasjoner for klinisk praksis
Helsepersonell trenger lett tilgjengelige retningslinjer av høy kvalitet for å kunne drive en kunnskapsbasert praksis, men mange retningslinjer er lite troverdige, og ingen anbefalinger passer alle pasienter (24, 25). Behandlingsansvarlig helsepersonell må derfor vurdere retningslinjer kritisk og ta stilling til om det er god og forsvarlig behandling å følge anbefalingene eller ikke.
Nasjonale faglige retningslinjer har en særstilling i Norge. I rundskriv er disse knyttet direkte mot forsvarlighetskravet i helsepersonelloven, som innebærer en plikt til å opptre i samsvar med de til enhver tid gjeldende faglige normer. «I dette ligger blant annet forventning om at nasjonale veiledere og retningslinjer følges», som det står i Helsedirektoratets kommentarer til helsepersonelloven (26).
Retningslinjer som ikke overholder standardene for troverdige retningslinjer, er både tidkrevende og faglig krevende å vurdere kritisk og kan derfor være vanskelig å stole på (24, 25). For eksempel, når en retningslinje mangler en god beskrivelse av oppdatert, systematisk litteraturgjennomgang som grunnlag for anbefalinger, sår det tvil om de gitte anbefalingene er rimelige. Vi kan ikke vite om all relevant kunnskap er vurdert eller om anbefalingene er basert på et skjevt kunnskapsgrunnlag. Dette øker snarere enn letter arbeidsbyrden for helsepersonell, som i praksis må lese seg grundig opp for å avgjøre om anbefalingene er til å stole på.
Vi har vist at tilfeldig utvalgte enkeltkapitler i nasjonale faglige retningslinjer i liten grad overholder standarder for troverdige retningslinjer. En slik manglende grad av overholdelse gjør det i våre øyne vanskelig å vurdere om de gitte anbefalingene er velfunderte. Dette er problematisk når helsemyndighetene samtidig har en forventning om at nasjonale faglige retningslinjer skal følges, og at det er et skjerpet krav om informasjon og pasientsamtykke dersom helsepersonell velger å fravike disse anbefalingene.
Som eneste produsent av nasjonale faglige retningslinjer har Helsedirektoratet et stort ansvar for å sørge for at alle retningslinjene til enhver tid er faglig oppdaterte og holder høy kvalitet. Basert på funnene i denne studien mener vi her å ha avdekket et rom for forbedring av nasjonale faglige retningslinjers metodiske kvalitet.
Datasett med konsensusskåringer for de vurderte retningslinjekapitlene er tilgjengelig i appendiks tabell A5. Individuelle skåringer kan deles til forskningsformål eller forbedringsarbeid ved å ta kontakt med forfatterne.
Artikkelen er fagfellevurdert.
- 1.
Helse- og omsorgsdepartementet. Lov om kommunale helse- og omsorgstjenester m.m. (helse- og omsorgstjenesteloven) https://lovdata.no/dokument/NL/lov/2011-06-24-30 Lest 12.7.2023.
- 2.
Helse- og omsorgsdepartementet. Lov om spesialisthelsetjenesten m.m. (spesialisthelsetjenesteloven) https://lovdata.no/dokument/NL/lov/1999-07-02-61 Lest 12.7.2023.
- 3.
Helsedirektoratet. Veileder for utvikling av kunnskapsbaserte retningslinjer. https://www.helsedirektoratet.no/veiledere/utvikling-av-kunnskapsbaserte-retningslinjer/Veileder%20for%20utvikling%20av%20kunnskapsbaserte%20retningslinjer%20(fullversjon).pdf/_/attachment/inline/efa406d5-9fe5-4ff5-9a8c-3f0e143c55c8:2cc6aceb8963dcfec76bc036a10402f12729b8ad/Veileder%20for%20utvikling%20av%20kunnskapsbaserte%20retningslinjer%20(fullversjon).pdf Lest 12.7.2023.
- 4.
Helsedirektoratet. Om Helsedirektoratets normerende produkter. https://www.helsedirektoratet.no/produkter/om-helsedirektoratets-normerende-produkter Lest 30.1.2023.
- 5.
Helse- og omsorgsdepartementet. Forskrift om pasientjournal (pasientjournalforskriften). https://lovdata.no/dokument/SF/forskrift/2019-03-01-168 Lest 12.7.2023.
- 6.
AGREE Collaboration. Development and validation of an international appraisal instrument for assessing the quality of clinical practice guidelines: the AGREE project. Qual Saf Health Care 2003; 12: 18–23. [PubMed][CrossRef]
- 7.
Atkins D, Best D, Briss PA et al. Grading quality of evidence and strength of recommendations. BMJ 2004; 328: 1490. [PubMed][CrossRef]
- 8.
Grimshaw J, Russell I. Achieving health gain through clinical guidelines. I: Developing scientifically valid guidelines. Qual Health Care 1993; 2: 243–8. [PubMed][CrossRef]
- 9.
Shekelle PG, Woolf SH, Eccles M et al. Clinical guidelines: developing guidelines. BMJ 1999; 318: 593–6. [PubMed][CrossRef]
- 10.
Graham R, Mancher M, Wolman DM et al. red. Clinical Practice Guidelines We Can Trust. Institute of Medicine (US) Committee on Standards for Developing Trustworthy Clinical Practice Guidelines. Washington DC: National Academies Press (US), 2011.
- 11.
Qaseem A, Forland F, Macbeth F et al. Guidelines International Network: toward international standards for clinical practice guidelines. Ann Intern Med 2012; 156: 525–31. [PubMed][CrossRef]
- 12.
Helsedirektoratet. Nasjonale anbefalinger, råd, pakkeforløp og pasientforløp. https://www.helsedirektoratet.no/produkter?tema=retningslinje Lest 31.1.2022.
- 13.
Helsedirektoratet. Forebygging og behandling av underernæring. https://www.helsedirektoratet.no/retningslinjer/forebygging-og-behandling-av-underernaering Lest 30.1.2023.
- 14.
Helsedirektoratet. Nasjonal faglig retningslinje for gravide i LAR og oppfølging av familiene frem til barnet når skolealder (2011). https://www.helsedirektoratet.no/retningslinjer/gravide-i-lar Lest 30.1.2023.
- 15.
Jue JJ, Cunningham S, Lohr K et al. Developing and Testing the Agency for Healthcare Research and Quality's National Guideline Clearinghouse Extent of Adherence to Trustworthy Standards (NEATS) Instrument. Ann Intern Med 2019; 170: 480–7. [PubMed][CrossRef]
- 16.
Guidelines Trust ECRI. TRUST scorecard overview. https://guidelines.ecri.org/about-trust-scorecard Lest 8.1.2022.
- 17.
Cohen J. Weighted kappa: nominal scale agreement with provision for scaled disagreement or partial credit. Psychol Bull 1968; 70: 213–20. [PubMed][CrossRef]
- 18.
Cluzeau FA, Littlejohns P, Grimshaw JM et al. Development and application of a generic methodology to assess the quality of clinical guidelines. Int J Qual Health Care 1999; 11: 21–8. [PubMed][CrossRef]
- 19.
Hayward RS, Wilson MC, Tunis SR et al. More informative abstracts of articles describing clinical practice guidelines. Ann Intern Med 1993; 118: 731–7. [PubMed][CrossRef]
- 20.
Shaneyfelt TM, Mayo-Smith MF, Rothwangl J. Are guidelines following guidelines? The methodological quality of clinical practice guidelines in the peer-reviewed medical literature. JAMA 1999; 281: 1900–5. [PubMed][CrossRef]
- 21.
Shiffman RN, Shekelle P, Overhage JM et al. Standardized reporting of clinical practice guidelines: a proposal from the Conference on Guideline Standardization. Ann Intern Med 2003; 139: 493–8. [PubMed][CrossRef]
- 22.
Mitchell M, Leas B, Lavenberg J et al. P247 a simple guideline appraisal instrument based on IOM standards. BMJ Qual Saf 2013; 22 (Suppl 1): A75. [CrossRef]
- 23.
Trust AGREE. http://www.agreetrust.org Lest 3.5.2023.
- 24.
Iannone P, Montano N, Minardi M et al. Wrong guidelines: why and how often they occur. Evid Based Med 2017; 22: 1–3. [PubMed][CrossRef]
- 25.
Kung J, Miller RR, Mackowiak PA. Failure of clinical practice guidelines to meet institute of medicine standards: Two more decades of little, if any, progress. Arch Intern Med 2012; 172: 1628–33. [PubMed][CrossRef]
- 26.
Helsedirektoratet. Helsepersonelloven med kommentarer. § 4. Forsvarlighet. https://www.helsedirektoratet.no/rundskriv/helsepersonelloven-med-kommentarer/krav-til-helsepersonells-yrkesutovelse/-4.forsvarlighet Lest 30.1.2023.
Langeland et als artikkel om svak troverdighet av nasjonale behandlingsretningslinjer er betimelig (1) og høyaktuell for psykiatri. Helsedirektoratet angir at nasjonale retningslinjer skal støtte opp under kliniske valg og påstår at rådene bygger på oppsummert og kvalitetsvurdert forskning. Det er dessverre en sannhet med store modifikasjoner. Innen psykiatri kan flertallet i en såkalt ekspertgruppe riktignok ha klinisk erfaring fra ulike ståsteder, men fullstendig mangle forskningserfaring og den metodologiske kunnskap som trengs for å vurdere kvalitet (eks. AGREE) og metodeproblemer i de studier som velges ut til kunnskapsoppsummeringene.
Et annet problem er at retningslinjer ikke er individtilpasset. De er basert på prinsippet «all sizes fit one», som er klinisk meningsløst. Et tredje problem er at nasjonale retningslinjer i psykiatri ofte ikke er oppdaterte. Den nasjonale behandlingsretningslinjen for depresjoner som ble publisert i 2009 ble betraktet som gjeldende i 14 år (2). Retningslinjene for bipolare lidelser ble publisert i 2012 (3). Behandlingsanbefalingene gjelder fortsatt, men inkluderer ikke forskning publisert de siste ti årene!
Langeland og medarbeidere anbefaler at legene må tenke selv. Det er jeg helt enig i. Men spesialistutdannelsen betoner i liten grad opplæring i kritisk vurdering av forskning. Mange stoler derfor på behandlingsretningslinjne og metaanalyser i kjente tidsskrifter selv om også disse kan ha betydelige metodeproblemer som gjør at konklusjonene kan være diskutable. Når helsemyndigheter heller ikke har nettsider hvor man kan påpeke mangler i kunnskapsgrunnlaget eller begrunnet uenighet om retningslinjene, synker den faglige gyldigheten av behandlingsretningslinjene ytterligere. Til syvende og sist er det pasientene som lider når behandlere føler seg presset til å ukritisk å følge retningslinjene slik Helsedirektoratet legger opp til.
Litteratur:
1. Langeland EA, Pisani SER, Kalager M et al. Følger Helsedirektoratets retningslinjer internasjonale standarder for troverdighet? Tidsskr Nor Legeforen 2023; 143. doi: 10.4045/tidsskr.23.0110
2. Nasjonal retningslinje for diagnostisering og behandling av voksne med depresjon i primær- og spesialisthelsetjenesten. 15-1561. Oslo: Helsedirektoratet, 2009 (Trukket tilbake 2023).
3. Nasjonal fagleg retningslinje for utgreiing og behandling av bipolare lidingar. IS-1925. Oslo: Helsedirektoratet, 2012. https://www.helsedirektoratet.no/retningslinjer/bipolare-lidingar/Bipolare%20lidingar%20%E2%80%93%20Nasjonal%20faglig%20retningslinje%20for%20utgreiing%20og%20behandling.pdf/_/attachment/inline/0a495dbf-91ed-4049-90c6-cb46f5babcda:b01d1720e1996ad7b30e8a4f5d4fe522b35265e1/Bipolare%20lidingar%20%E2%80%93%20Nasjonal%20faglig%20retningslinje%20for%20utgreiing%20og%20behandling.pdf Lest 17.10.2023.
Andreas Stensvold, leder oppdateringsgruppe for handlingsprogram prostatakreft
Vi gratulerer gruppen og spesielt de to første forfatterne, begge medisinerstudenter, med en type helsetjenesteforskning som vi burde se mer av i Norge (1). Studien viste at det er en del svakheter i retningslinjearbeid som det er. 9 av 12 domener i skåringsverktøy NEATS viste svært lav eller lav overholdelse av standardene. Lavest var skårene for studieseleksjon, beskrivelse av studier og resultater, gradering av styrken på anbefalingen og ekstern høring. Høyest skår fikk domenen spesifikk og utvetydig formulering av anbefalingene. De onkologiske retningslinjer skårer generelt dårligere enn gjennomsnitt, men skilte seg ut med bedre oppdatering, en klar forbedring de siste årene (2).
Dette er viktige innspill på hva som forventes av en troverdig retningslinje. Men det er også et poeng at det er begrenset hva man kan forvente med tanke på at dette i all hovedsak er dugnadsarbeid, og hvor man prioriterer raske og brukervennlige oppdateringer i stedet for veldig stringent metodikk.
Systematisk vurdering av evidens er enormt krevende og med dagens ressurser som regel ikke gjennomførbart. Det er grenser for hva vi kan oppnå i små land som Norge og for hvor klare konklusjoner vi kan komme til ved kunnskapsoppsummering i en dynamisk verden. Vi kan støtte oss på gode internasjonale retningslinjer med systematisk vurdering av evidens. Prostatakreft handlingsprogram er nå basert på EAUs ambisiøse arbeid med europeiske retningslinjer (3) og programmet refererer omfattende til enkeltkapitler i EAU prostatacancer guidelines.
Evaluering av programmene bør bli bedre. Tilbakemelding skjer tilfeldig og ikke strukturert, formelt i henvendelser til direktoratet eller til leder for handlingsprogram, og uformelt i form av diskusjon i fagmiljø. Selv om oppdateringen av onkologiske handlingsprogram er blitt bedre (13/28 retningslinjer var oppdaterte innen et år før data cutoff 31.1.2022), skaper det frustrasjon at annonserte og gjennomførte oppdateringer ikke blir tilgjengelig av ymse grunner. Det gjelder også Helsedirektoratets egen veileder for arbeid med retningslinjer som var annonsert oppdatert i 2015 (4). Retningslinjer bør ta hensyn til klinikerens tid, et punkt som ikke er med i NEATS (5). Og omtale av finansiering og habilitet er viktig og enkelt å gjennomføre.
Vi opplever at mange retningslinjer i onkologi anerkjennes og brukes daglig, nyter stor troverdighet og gir «gode anbefalinger for klinisk praksis» selv om de ikke oppfyller NEATS-kriteriene. Metodikken for arbeid med handlingsprogrammene bør oppdateres. Og arbeidet til Langeland, Pisani og medarbeidere bør være til inspirasjon for tilsvarende helsetjenesteforskning, gjerne av studenter.
Litteratur:
1. Langeland EA, Pisani SER, Kalager M et al. Følger Helsedirektoratets retningslinjer internasjonale standarder for troverdighet? Tidsskr Nor Legeforen 2023; 143. doi: 10.4045/tidsskr.23.0110
2. Nilsen S. Går hardt ut imot handlingsprogrammene. Dagens medisin 12.4.2012. https://www.dagensmedisin.no/helsepolitikk-og-helseokonomi-2-kreft-politikk-og-okonomi/gar-hardt-ut-imot-handlingsprogrammene/317908 Lest 12.10.2023
3. Guidelines Office strategy 2022 to 2027. Arnhem: European Association of Urology, 2021. https://d56bochluxqnz.cloudfront.net/media/EAU_GO_strategy_2022_2027_final.pdf Lest 12.10.2023
4. Veileder for utvikling av kunnskapsbaserte retningslinjer. IS-1870. Oslo: Helsedirektoratet, 2012. https://www.helsedirektoratet.no/veiledere/utvikling-av-kunnskapsbaserte-retningslinjer/Veileder%20for%20utvikling%20av%20kunnskapsbaserte%20retningslinjer%20(fullversjon).pdf/_/attachment/inline/efa406d5-9fe5-4ff5-9a8c-3f0e143c55c8:2cc6aceb8963dcfec76bc036a10402f12729b8ad/Veileder%20for%20utvikling%20av%20kunnskapsbaserte%20retningslinjer%20(fullversjon).pdf Lest 12.10.2023
5. Johansson M, Guyatt G, Montori V. Guidelines should consider clinicians' time needed to treat. BMJ. 2023 Jan 3;380:e072953. doi: 10.1136/bmj-2022-072953.
Se også denne debattartikkelen: Slik lager vi nasjonale faglige retningslinjer