- 1.
Stensen O-A, Schrøder Hansen K. For mye, for lite eller akkurat passe? Om variasjon, over- og underforbruk i helsetjenesten.https://www.legeforeningen.no/contentassets/ba01fe487d894fd08516b5a803ba7b7b/for-mye_for-lite-eller-akkurat-passe.pdf Accessed 30.5.2024.
- 2.
World Health Organization. World health statistics 2010. https://iris.who.int/bitstream/handle/10665/44292/9789241563987_eng.pdf?sequence=1 Accessed 30.5.2024.
- 3.
OECD. Tackling Wasteful Spending on Health. https://www.oecd.org/health/tackling-wasteful-spending-on-health-9789264266414-en.htm Accessed 30.5.2024.
- 4.
Berwick DM, Hackbarth AD. Eliminating waste in US health care. JAMA 2012; 307: 1513–6. [PubMed][CrossRef]
- 5.
Soril LJJ, Seixas BV, Mitton C et al. Moving low value care lists into action: prioritizing candidate health technologies for reassessment using administrative data. BMC Health Serv Res 2018; 18: 640. [PubMed][CrossRef]
- 6.
Baugstø V. Gjør kloke valg Norge rundt. https://tidsskriftet.no/2019/01/aktuelt-i-foreningen/gjor-kloke-valg-norge-rundt Accessed 30.5.2024.
- 7.
Colla CH, Morden NE, Sequist TD et al. Choosing wisely: prevalence and correlates of low-value health care services in the United States. J Gen Intern Med 2015; 30: 221–8. [PubMed][CrossRef]
- 8.
Pfadenhauer LM, Gerhardus A, Mozygemba K et al. Making sense of complexity in context and implementation: the Context and Implementation of Complex Interventions (CICI) framework. Implement Sci 2017; 12: 21. [PubMed][CrossRef]
- 9.
Hendee WR, Becker GJ, Borgstede JP et al. Addressing overutilization in medical imaging. Radiology 2010; 257: 240–5. [PubMed][CrossRef]
- 10.
Sheng AY, Castro A, Lewiss RE. Awareness, Utilization, and Education of the ACR Appropriateness Criteria: A Review and Future Directions. J Am Coll Radiol 2016; 13: 131–6. [PubMed][CrossRef]
- 11.
Kjelle E, Andersen ER, Soril LJJ et al. Interventions to reduce low-value imaging - a systematic review of interventions and outcomes. BMC Health Serv Res 2021; 21: 983. [PubMed][CrossRef]
- 12.
Størdal K, Hjörleifsson S. Fem år med Gjør kloke valg – hjelper det? Tidsskr Nor Legeforen 2023; 143. doi: 10.4045/tidsskr.23.0627. [PubMed][CrossRef]
- 13.
Cliff BQ, Avanceña ALV, Hirth RA et al. The impact of Choosing Wisely interventions on low-value medical services: a systematic review. Milbank Q 2021; 99: 1024–58. [PubMed][CrossRef]
- 14.
Håberg AK, Hammer TA, Kvistad KA et al. Incidental Intracranial Findings and Their Clinical Impact; The HUNT MRI Study in a General Population of 1006 Participants between 50-66 Years. PLoS One 2016; 11. doi: 10.1371/journal.pone.0151080. [PubMed][CrossRef]
- 15.
Hofmann B. For sikkerhets skyld: om skylden i vår søken etter sikkerhet. Bibl Laeger 2005; 197: 353–64.
- 16.
Lydersen S. Hva er sannsynligheten for riktig resultat av en diagnostisk test? Tidsskr Nor Legeforen 2017; 137. doi: 10.4045/tidsskr.17.0409. [PubMed][CrossRef]
- 17.
Doubilet PM. Statistical techniques for medical decision making: applications to diagnostic radiology. AJR Am J Roentgenol 1988; 150: 745–50. [PubMed][CrossRef]
- 18.
Macartney FJ. Diagnostic logic. Br Med J (Clin Res Ed) 1987; 295: 1325–31. [PubMed][CrossRef]
- 19.
Hofmann B. Too Much, Too Mild, Too Early: Diagnosing the Excessive Expansion of Diagnoses. Int J Gen Med 2022; 15: 6441–50. [PubMed][CrossRef]
- 20.
Hofmann B, Brandsaeter IØ, Kjelle E. Variations in wait times for imaging services: a register-based study of self-reported wait times for specific examinations in Norway. BMC Health Serv Res 2023; 23: 1287. [PubMed][CrossRef]
- 21.
Han PK, Klein WM, Arora NK. Varieties of uncertainty in health care: a conceptual taxonomy. Med Decis Making 2011; 31: 828–38. [PubMed][CrossRef]
- 22.
Hofmann BM, Lysdahl KB. Types of diagnostic uncertainty – defining them and addressing them. I: Lalumera E, Fanto S, red. Philosophy of Advanced Medical Imaging. New York, NY: Springer, 2020.
- 23.
Han PK. Uncertainty in medicine: a framework for tolerance. Oxford: Oxford University Press, 2021.
- 24.
Arbeids- og sosialdepartementet. Samvittighetsfrihet i arbeidslivet. https://www.regjeringen.no/contentassets/3f93bdb31a5942fba104512d4a3b8f00/no/pdfs/nou201620160013000dddpdfs.pdf Accessed 30.5.2024.
- 25.
Brandsæter IØ, Andersen ER, Hofmann BM et al. Drivers for low-value imaging: a qualitative study of stakeholders' perspectives in Norway. BMC Health Serv Res 2023; 23: 295. [PubMed][CrossRef]
- 26.
Saini V, Garcia-Armesto S, Klemperer D et al. Drivers of poor medical care. Lancet 2017; 390: 178–90. [PubMed][CrossRef]
- 27.
Hofmann BM. Biases and imperatives in handling medical technology. Health Policy Technol 2019; 8: 377–85. [CrossRef]
- 28.
Hofmann B. Biases distorting priority setting. Health Policy 2020; 124: 52–60. [PubMed][CrossRef]
- 29.
Hofmann B, Skolbekken JA. Surge in publications on early detection. BMJ 2017; 357: j2102. [PubMed][CrossRef]
- 30.
Krogsbøll LT, Jørgensen KJ, Grønhøj Larsen C et al. General health checks in adults for reducing morbidity and mortality from disease: Cochrane systematic review and meta-analysis. BMJ 2012; 345 (nov20 3). doi: 10.1136/bmj.e7191. [PubMed][CrossRef]
- 31.
Liss DT, Uchida T, Wilkes CL et al. General health checks in adult primary care: a review. JAMA 2021; 325: 2294–306. [PubMed][CrossRef]
()
Tilfeldige funn hos folk oppi årene har blitt en driver i sykehusene. For eksempel fra pakkeforløp/utredning ved den minste mistanke om kreft. Da finner man alltid noe å spinne videre på. Tror det het Ulysses-syndromet den gangen jeg gikk i læra.
Takk til Fredrik Wilhelm Bugge for denne viktige kommentaren. Betegnelsen "Ulysses-syndromet" kan spores tilbake til 1972 og viser til pasienters endeløse diagnostiske reiser som følge av tilfeldige funn – ofte med unødvendig behandling og skade som resultat (1).
Det er et grunnleggende paradoks at de samme diagnostiske tester som kan avslutte fortvilede pasienters endeløse reiser på søken etter en forklaring på sine plager, også kan initiere slike uendelige diagnostiske reiser. De kan skape den samme fortvilelse, plage og lidelse som de kan stanse.
Klare symptomer, diagnostiske hypoteser og høy pretestsannsynlighet bidrar til å stille sikre diagnoser, mens eksplorativ testing med lav pretestsannsynlighet oftest gjør mer skade enn nytte. Derfor stilles det strengere krav til screeningtester. Dessverre er grensene for undersøkelse og screening uklare. Det er lett å tro at man bedriver begrunnet diagnostikk når man i praksis driver villscreening (2).
Diagnostiske tester kan både avslutte og starte diagnostiske odysséer. Kloke klinikere bruker dem til det første og unngår det siste.
Litteratur:
1. Rang M. The Ulysses syndrome. Canadian Medical Association Journal. 1972;106(2):122.
2. Enden T. På sjekkemarkedet. Tidsskrift for Den norske legeforening. 2024;144.
I en diskusjon om tilfeldig utførte røntgenundersøkelser og tilfeldige resultater (1) blir betydningen av ordet tilfeldig avgjørende. Brukt i en vitenskapelig og statistisk sammenheng er følgende påpekt (2): «Tilfeldig betyr at vi ikke kan forutsi hva resultatet skal bli.»… «tilfeldig er når vi triller en terning».
Hofmann viser til et arbeide hvor det engelske begrepet «incidental» er benyttet (3) og oversetter det til «tilfeldig». «Incidental» betyr imidlertid at noe er forventet, men forkommer sjeldent (4). Røntgenundersøkelser for (primært) å se etter et brudd vil en sjelden gang (sekundært) påvise kreft. Funnet av kreft er da «incidental», altså forventet og sykdommens prevalens forteller oss hvor ofte vi bør gjøre funnet.
Vi har også tilstrekkelig kompetanse til å avgjøre hvilke funn som bør følges opp. Betegnelsen "Ulysses-syndromet" viser forøvrig ikke til «pasienters endeløse diagnostiske reiser som følge av tilfeldige funn» (5), men til en feiltolkning av et røntgenbilde (6).
Prevalens tilsvarer pretest sannsynlighet. Med henvising til en artikkel om hvordan medisinske beslutninger kan fattes (7) hevder Hofmann at hvis pretest sannsynlighet er lav «vil gyldighet for resultatet være lav» og at «testresultatet mest sannsynlig er feil». Nytten av tidlig påvisning av en alvorlig sykdom er selvsagt ikke avhengig av sykdommens prevalens, det er heller ikke kvaliteten på det radiologiske arbeidet.
Hofmann hevder at for enkelte røntgenundersøkelser er det 100 prosent dokumentert at de ikke har noen verdi. Arbeidet han baserer dette på (8) er en diskusjon om hvordan man kan håndtere multiple faktorer, men arbeidet gir ingen slik vurdering av røntgenundersøkelser. Videre hevder Hofmann at 20-50 prosent av røntgenundersøkelser er unødvendige. I ett av arbeidene han baserer seg på (9) påpekes følgende: «These percentages should be interpreted cautiously, however, because they fail to acknowledge the value of negative imaging studies in influencing decisions about patient treatment and management.»
Referanser
1. Hofmann B. https://tidsskriftet.no/2024/07/kronikk/pa-forhand-kan-man-ikke-vite
2. Mamen A. https://www.kristiania.no/kunnskap-kristiania/2022/01/det-er-kanskje-ikke-sa-tilfeldig-som-du-tror/
3. Håberg AK, Hammer TA, Kvistad KA et al. Incidental Intracranial Findings and Their Clinical Impact; The HUNT MRI Study in a General Population of 1006 Participants between 50-66 Years. PLoS One 2016; 11: e0151080. [PubMed][CrossRef]
4. https://dictionary.cambridge.org/dictionary/english/incidental
5. Hofmann B. https://tidsskriftet.no/2024/07/kommentar/avslutt-ikke-start-diagnostiske-odysseer
6. Rang M. The Ulysses syndrome. Canadian Medical Association Journal. 1972;106(2):122. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC1940359/pdf/canmedaj01635-0023.pdf
7. Macartney FJ. Diagnostic logic. Br Med J (Clin Res Ed) 1987; 295: 1325–31. [PubMed][CrossRef]
8. Pfadenhauer LM, Gerhardus A, Mozygemba K et al. Making sense of complexity in context and implementation: the Context and Implementation of Complex Interventions (CICI) framework. Implement Sci 2017; 12: 21. [PubMed][CrossRef]
9. Hendee WR, Becker GJ, Borgstede JP et al. Addressing overu
Takk til Arne Høiseth for interessant kommentar til min kronikk. Jeg er helt enig med Høiseth i at klare begreper er en viktig forutsetning for god formidling og debatt. Høiseth har helt rett i at jeg, i likhet med mange andre, har oversatt «incidental findings» med tilfeldige funn.
Når Høiseth bruker høyskoleketor Anders Mamen ved Høyskolen Kristiania som sannhetsvitne for betydningen av begrepet «tilfeldig», blir det feil. Mamen påpeker at det er feil å si at «det var tilfeldig at en direktør i bedriften sluttet». Det har Mamen selvsagt helt rett i, men det gir neppe noen uttømmende og autoritær forståelse av begrepet tilfeldige funn i medisinen.
Høiseth er også høyst selektiv når han skriver at tilfeldig «betyr imidlertid at noe er forventet, men forkommer sjeldent» med henvisning til en nettversjon av Cambridge Dictionary (1). På nettstedet han viser til, står det derimot at «incidental» betyr «happening by chance, or in connection with something else that is more important» og «less important than the thing something is connected with or part of» .
«Tilfeldig» er i Det Norske Akademi’s ordbok forklart som det «som beror på eller forekommer ved et sammentreff; som ikke er resultat av noen (bevisst) beslutning» (2). Det er nettopp det som skjer ved tilfeldige funn innen diagnostikk: man finner noe som man ikke hadde noen bevisst beslutning om å lete etter – et uventet funn som ikke er relatert til den opprinnelige diagnostiske intensjonen. Det er altså ikke forventet, slik Høiseth hevder.
American College of Radiology definerer tilfeldige funn på følgende måte: «An incidental finding, also known as an incidentaloma, may be defined as “an incidentally discovered mass or lesion, detected by CT, MRI, or other imaging modality performed for an unrelated reason.”» (3) Tilfeldige funn er altså ikke forventede (unanticipated) og ikke relatert til det som man gjør en undersøkelse for (som plager pasienten) (4).
Mer overraskende og alvorlig er det at Høiseth skriver at «Prevalens tilsvarer pretest sannsynlighet.» Hvis man ikke har annen kunnskap om pasienten, vil sannsynligheten for at pasienten har tilstanden man mistenker, før man tar testen (altså pretestsannsynligheten), være lik prevalensen. Men prevalensen er bare en av flere kilder til å kvalifisere pretestsannsynligheten. Kloke klinikere bruker sykehistorie, symptomer, og kliniske undersøkelser til å kvalifisere pretestsannsynligheten. Jeg håper og tror at Arne Høiseth bruker informasjonen som står på henvisningene han får, når han diagnostiserer.
Problemet med tilfeldige funn, slik de defineres av American College of Radiology, er at man ikke har hatt noen forventing om å finne dem, slik at pretestsannsynligheten er lav. Da blir post-test-sannsynligheten (og gyldigheten av testresultatet) lav (5).
Referanser:
1. https://dictionary.cambridge.org/dictionary/english/incidental 2. https://naob.no/ordbok/tilfeldig
3. https://www.acr.org/Clinical-Resources/Incidental-Findings
4. Davenport MS. Incidental finding AJR 2023;221:117-123
5. Fagan, T.J. Nomogram for Bayes theorem. NEJM 1975;293
Påstanden om at «tilfeldige» røntgenfunn har lav verdi, eller kan være feil (1), knyttes til Fagans nomogram (2). Nomogrammet skal gjøre det mulig, etter at en undersøkelse er utført, å lese av sannsynligheten for at en person har en sykdom ved å plotte inn sannsynligheten for å ha sykdommen før testen er utført (pre-test sannsynlighet) og ratio mellom testens sensitivitet og spesifisitet, benevnt «likelyhood ratio» (LR). Fagans nomogram er basert på Bayes' matematikk som er komplisert og lite brukt i medisinen, men matematikken anbefales sammen med, eller i stedet for tradisjonell statistikk (3).
Et «tilfeldig» funns pretest sannsynlighet vil oftest være funnets prevalens. Med pretest sannsynlighet for svulst brystet på 2 prosent (prevalens) og sensitivitet og spesifisitet henholdsvis 75 (andel sanne positive funn) og 96 prosent (andelen sanne negative funn), blir post-test sannsynlighet 28 prosent (4). Hva 28 prosent betyr i forstår jeg ikke.
Jeg vil fastholde at vi radiologer vet hvilke «tilfeldige» funn, ofte benevnt bifunn, som kan forekomme. Dessuten, vi har kriterier til å avgjøre betydningen av bifunn. De fleste bifunn har ingen eller lav betydning. De viktigste er de som gir mistanke om kreft (solide lesjoner). Disse forekommer så sjeldent som i 1 prosent av undersøkelsene. Men, de blir ikke av lav betydning eller feilaktige på grunn av at de forekommer sjeldent, slik Bayes' beregning kan indikere. Jeg fastholder at det er de radiologiske kriterier som er avgjørende. Det er først og fremst testens sensitivitet som bør tillegges betydning.
Litteratur:
1. Hofmann B. Hvorfor spørre når man vet svaret? Hofman svarer Høiseth. Tidsskriftet 17.07.2024 https://tidsskriftet.no/2024/07/kommentar/hvorfor-sporre-nar-man-vet-svaret-hofmann-svarer-hoiseth Lest 03.09.2024.
2. Fagan, TJ. Letter: Nomogram for Bayes's theorem. N Engl J Med 1975; 293(5): 257. doi: 10.1056/NEJM197507312930513.
3. Aursnes I, Natvig B, Tvete IF. Bayesiansk tenkemåte på vei inn i medisinsk statistikk? Tidsskr Nor Lægeforen 2002; 122: 1369-72 https://tidsskriftet.no/2002/05/aktuelt-problem/bayesiansk-tenkemate-pa-vei-inn-i-medisinsk-statistikk
4. Caraguel CGC, Vanderstichel, R. The two-step Fagan's nomogram: ad hoc interpretation of a diagnostic test result without calculation. Evid Based Med 2013; 18(4): 125-8. doi: 10.1136/eb-2013-101243.
Takk igjen til Arne Høiseth for muligheten til å utdype om testers nøyaktighet og nytte. Jeg er verken lege eller radiolog, så jeg skal ikke si noe om den praktiske diagnostikken, men bare om den generelle diagnostiske rasjonaliteten.
Jeg skal avgrense meg til å kommentere en av Høiseths mange påstander: «Det er først og fremst testens sensitivitet som bør tillegges betydning» (1). Sensitiviteten til en test sier noe om hvor god en test er til å identifisere de som er syke i en populasjon. Det vil si hvis vi bruker en gitt test med sensitivitet på 0,75 på en gruppe på 100 mennesker med en gitt sykdom, så klarer testen å identifisere 75 av disse.
Klinikerens problem er ikke hvor mange i en syk befolkning som testen klarer å identifisere, men hvorvidt hen kan stole på testresultatet som vedkommende har fått for en gitt pasient. Sett at testresultatet for en pasient er positivt, hvor sannsynlig er det at dette testresultatet er sant? Det vil si hvor høy er testens positive prediktive verdi (PPV)?
Dersom pasienten har klare symptomer for sykdommen som testresultatet indikerer, øker det sannsynligheten for at testresultatet er korrekt. Men ved tilfeldige funn (som definert i litteraturen) (2), så har vi ingen slike symptomer.
Derimot kan (det positive) testresultatet være feil, det vil si at vi kan få et falskt positivt testresultat. I Høiseths eksempel, med en spesifisitet på 0,96, vil en få fire falskt positive testresultater om en undersøker 100 personer som ikke har den aktuelle tilstanden. Radiologen, som gjør et tilfeldig funn, har undersøkt mange hundre personer, og må spørre seg om det aktuelle funnet er en av disse falske positive testresultatene.
Hen vet at dersom forekomsten av den aktuelle tilstanden er lav, er sannsynligheten for å gjøre et positivt testfunn lav. Hen vet også at sannsynligheten for feilaktig å gjøre et positivt funn er 4%. Det vil si at hen må være forberedt på å finne et falskt positivt funn for hver 25. person uten tilstanden som testes. Radiologen vet også at hen har undersøkt veldig mange personer uten å få et positivt funn for denne tilstanden. Det er derfor meget godt mulig at akkurat dette funnet er et falskt positivt testresultat.
Hvor sannsynlig dette er, sier PPV noe om. Om vi antar at forekomsten av tilstanden er på 1% (slik Høiseth beskriver), får vi følgende:
PPV = sensitivitet*prevalens/[sensitivitet*prevalens + (1-spesifistet)*(1-prevalens)] = 0,75*0,01/[0,75*0,01 + (1-0,96)*(1-0,01)] = 0,1592
Det vil si at vi har en PPV på nær 16%, som tilsier at det er 84% sannsynlighet for at den positive testen er feil – altså at det tilfeldige funnet er et falskt positivt funn. Det er lav prevalens, og derved lav PPV, som gjør at det stilles særlig strenge krav til screeningtester (3).
Jeg skal være den første til å innrømme at dette ikke er enkelt å forstå, men NRK har laget en god fremstilling (4).
Ved tilfeldige funn er pretestsannsynligheten lik prevalensen. Hvis prevalens er lav, er PPV lav, og testresultatet er ikke til å stole på (5). Da er det en betydelig sjanse for at pasienten sendes på unødvendige diagnostiske odysseer.
Derfor bør man ikke stirre blindt på testens sensitivitet når man tar en test.
Litteratur:
1. Høiseth A. Prevalens avgjør ikke et bifunns betydning. Tidsskr Nor Legeforen. https://tidsskriftet.no/2024/09/kommentar/prevalens-avgjor-ikke-et-bifunns-betydning Lest 15.09.2024.
2. Hofmann B. Hvorfor spørre når man vet svaret? Hofmann svarer Høiseth. Tidsskr Nor Legeforen. https://tidsskriftet.no/2024/07/kommentar/hvorfor-sporre-nar-man-vet-svaret-hofmann-svarer-hoiseth Lest 15.09.2024.
3. Wilson JMG, Jungner G. Principles and practice of screening for disease. Geneve: World Health Organization (WHO), 1968.
4. Folkeopplysningen. 2020, episode: Kroppen på service. Tv-program. NRK TV 7.9.2020. https://tv.nrk.no/serie/folkeopplysningen/2020/KMTE50003120/avspiller
5. Kraemer HC. Evaluating medical tests: Objective and quantitative guidelines. Newbury Park, CA: Sage publications, 1992.