Medicine and numbers

Hva skal til for å tro på en ikke-underlegenhetsstudie?

Medisin og tall

02.06.2026: Ikke-underlegenhetsstudier er sårbare for avvik fra studieprotokollen. Gode prosedyrer for å forhindre og dokumentere avvik er spesielt viktig for å vurdere påliteligheten av resultatene fra slike studier. Kliniske studier med en aktiv komparator er aktuelle når det ikke er mulig eller ønskelig at pasienter blir randomisert til en placebogruppe. Formålet kan være å vise at en ny behandling er bedre enn, eller har sammenliknbar effekt med, etablert behandling (1). At to behandlinger har lik effekt, kan man ikke vise (2), men sammenliknbar effekt kan vises ved en ikke-underlegenhetsstudie. Ofte...

Grafikkens grammatikk

Medisin og tall

19.03.2026: Grafisk presentasjon av data og statistiske resultater er ofte lettere tilgjengelig enn numeriske oppsummeringer og tabeller. Grammatikk er verktøyet som strukturerer formidlingen, både språklig og grafisk. For å få til noe meningsfullt er det fornuftig å sette sammen elementer etter en bestemt struktur. Det gjelder så vel for språk, som for bygningskonstruksjoner og pasientbehandling. Dessverre blir ofte grafisk fremstilling av data og statistiske resultater til underveis, uten en bestemt plan for datautvalg, grafikktype og utseende. Leland Wilkinson (1944–2021) har utviklet et grammatisk...

Kan kunstig intelligens være din statistiske assistent?

Medisin og tall

10.03.2026: Kunstig intelligens (KI) preger stadig mer av medisinens verden, til både glede og frustrasjon. Men hva skjer når vi slipper teknologien løs på statistikken? Språkmodeller kan skrive kode og forklare analyser på sekunder, men er de til å stole på? Du sitter med et datasett, men husker ikke syntaksen for en blandet modell i Stata eller hvordan du justerer for multippel testing i R. Tradisjonelt sett har løsningen vært tunge manualer eller timevis på Google. Nå har vi fått store språkmodeller som ChatGPT, Claude og Gemini. Forenklet sagt fungerer disse ved å analysere enorme mengder tekst for å...

Hvilke variabler bør være med i en regresjonsmodell?

Medisin og tall

20.02.2026: Valg av variabler som skal inkluderes i en regresjonsmodell, avhenger i stor grad av forskningsspørsmålet og studiedesignen. Det kan være hensiktsmessig å dele observasjonelle studier i tre kategorier: deskriptive, prediktive og kausale (1). Eksempler på forskningsspørsmål i de tre kategoriene er vist i tabell 1. I de to sistnevnte er det ofte aktuelt å benytte en regresjonsmodell i den statistiske analysen. Tabell 1 Eksempler på forskningsspørsmål i ulike kategorier observasjonelle studier Deskriptiv Prediktiv Kausal Prevalens av atrieflimmer blant individer > 65 år Sannsynlighet for iskemisk...

Statistisk analyseplan

Medisin og tall

20.01.2026: Før man analyserer data, bør man skrive en statistisk analyseplan. På denne måten gjør man forskningen mer transparent, og man øker reproduserbarheten. De valgene man tar i forbindelse med de statistiske analysene, vil påvirke de resultatene man får. Hvis valgene rundt håndtering av data og analyser påvirkes av hvilke resultater man får underveis, øker faren for at funnene ikke blir reproduserbare i senere studier. Derfor er det viktig å planlegge analysene på forhånd og å følge planen så godt som mulig. Ellers risikerer man å prøve forskjellige metoder og velge de resultatene som passer best...

Kan vi bli SMARTere?

Medisin og tall

25.09.2025: Mye pasientbehandling er i praksis basert på prøving og feiling (persontilpasning), i sterk kontrast til det typiske one-size-fits-all-designet i medisinsk forskning. Den randomiserte kliniske studien er gullstandarden for å finne ut om en behandling har en effekt på et gitt utfall. Med to grupper er gjennomsnittlig endring i hele utvalget uttrykk for effekt uten persontilpasning. Hvis personinformasjon kan utnyttes slik at alle får det beste alternativet, og ikke nødvendigvis det de i utgangspunktet ble randomisert til å få, vil gjennomsnittlig endring i hele utvalget uttrykke effekt ved...

Latente variabler

Medisin og tall

20.09.2025: Mange viktige egenskaper ved helse, medisin og atferd, som for eksempel motivasjon, depresjon eller kognisjon, er ikke direkte fysisk målbare. De er underliggende egenskaper, også kalt latente variabler, som ofte er assosiert med målbare og observerbare variabler. Vekt, lengde og tid er eksempler på egenskaper vi måler med fysiske instrumenter. Valide og reproduserbare fysiske målinger er avgjørende for diagnostikk, pasientbehandling og medisinsk forskning. Likevel er mange helsetilstander – deriblant mental helse og livskvalitet – egentlig ikke fysisk målbare. Måleinstrumenter for latente...

Hva er en genomvid assosiasjonsstudie?

Medisin og tall

28.08.2025: I en genomvid assosiasjonsstudie (genome-wide association study, GWAS) forsøker man å identifisere genetiske varianter som er assosiert med en sykdom eller en fenotype. Vanligvis tester man flere millioner genetiske varianter fra hele genomet i repeterte regresjonsmodeller. En genetisk variant refererer til en endring i nitrogenbasene (A, C, G, T) på en spesifikk posisjon i genomet. Forenklet kan man si at en genetisk variant forekommer dersom for eksempel flesteparten har en A på en spesifikk posisjon i genomet, mens en mindre del av befolkningen har en T. I en genomvid assosiasjonsstudie...

Hva skal studien vise?

Medisin og tall

06.03.2025: Når man planlegger en studie, er det viktig å ha klart for seg spørsmålet man ønsker å besvare. I randomiserte kontrollerte kliniske studier er man ofte ute etter å vise at en ny behandling er bedre enn den eksisterende, men det kan også være at spørsmålet er om den nye behandlingen er like god, eller ikke dårligere, enn den eksisterende behandlingen. De tre tilnærmingene er grunnleggende forskjellige, og valget må gjøres før studien igangsettes. Om man forsøker å vise at én behandling er bedre enn en annen, og feiler, kan man ikke konkludere med at de er like gode (1). Er ny behandling bedre...

Berksons paradoks: Når det trengs friske individer for å beskrive sykdom

Medisin og tall

25.02.2025: Man skulle tro at et sykehus var et godt sted å studere sykdom. Paradoksalt nok vil fraværet av friske individer kunne føre til at man finner sammenhenger i tallene som egentlig ikke er der. Anne er på utkikk etter en kjæreste. Helst ønsker hun seg en mann hun synes er både veldig kjekk og veldig snill. Men – man kan ikke alltid få i pose og sekk, og Anne er fornøyd med en viss balanse: En mann der summen av kjekkhet og snillhet til sammen er tilstrekkelig høy (1). Etter en rekke dater kommer Anne med et hjertesukk til sine venner. Kjekke menn er ikke noe snille, forteller hun. Faktisk, jo...

Hva kjennetegner en god prediksjonsmodell?

Medisin og tall

18.02.2025: Det finnes mange kliniske prediksjonsmodeller som hevder å forutsi risikoen for nåværende eller fremtidig sykdom. Men hvilke egenskaper kjennetegner en god modell? Kliniske prediksjonsmodeller som vil si noe om pasientens diagnose, prognose eller valg av behandlingsforløp, utvikles fortløpende. For å vurdere kvaliteten og relevansen av disse modellene bør egenskapene til modellen være godt kartlagt (1, 2). Et illustrativt eksempel kan være beskrivelsen av en prediksjonsmodell om tilbakefall ved multippel sklerose (3). Forskningsspørsmålet, dataene og den statistiske analysen Det første steget...

Hva er bias?

Medisin og tall

06.02.2025: Begrepet bias har ulike fortolkninger i ulike disipliner. I statistikk betyr bias at en metode ikke besvarer forskningsspørsmålet av interesse. Men er bias en egenskap til estimander, estimatorer eller estimater? Og hva betyr disse begrepene? Anta at vi ønsker å studere effekten av koloskopiscreening versus ingen screening på tiårsrisikoen for død av tarmkreft hos personer over 55 år. Svaret på dette forskningsspørsmålet, for eksempel kvantifisert som en risikodifferanse eller -ratio, er et eksempel på en estimand. Vi analyserer data for å finne en tilnærming til dette svaret, altså til...

Romlige data i medisin og helsefag

Medisin og tall

13.01.2025: Vi registrerer ofte geografiske eller stedfestede opplysninger i medisinske og helsefaglige prosjekter. Men hvordan tar vi hensyn til den romlige komponenten når vi skal analysere slike data? Eksempler på geografiske opplysninger er fylkeshelseundersøkelsene, som blant annet inneholder opplysninger om hvilken kommune, bydel eller postnummer deltakerne bor i. Kliniske studier kan inneholde opplysninger om hvilket sykehus eller hvilken helseregion pasientene er rekruttert fra. Vi er alle knyttet til et geografisk område, og i folkehelsevitenskap vet vi at egenskaper knyttet til dette området har...

Kostnadseffektivitetsanalyser – hvordan beregnes helsegevinster?

Medisin og tall

05.12.2024: Kvalitetsjusterte leveår (quality-adjusted life years, QALYs) er det anbefalte målet for helsegevinst i kostnadseffektivitetsanalyser. QALYs kombinerer helserelatert livskvalitet og levetid. Mens levetid er lett å måle, er helserelatert livskvalitet mer kompleks. Kostnadseffektivitetsanalyser gjennomføres for å gi informasjon om hvordan begrensede ressurser best kan fordeles, slik at vi får mest mulig helse for pengene. Dette innebærer å estimere hvor mye ressurser et tiltak krever, sett opp mot hvilke helsegevinster tiltaket gir (1). Men hvordan skal helsegevinster beregnes? Kvalitetsjusterte...

Flernivåanalyser

Medisin og tall

07.10.2024: I enkelte studier er data samlet inn fra grupper eller klynger, slik at data fra samme gruppe er mer lik hverandre enn data fra forskjellige grupper. Dette må tas hensyn til i statistiske analyser. Data kan være samlet i grupper eller klynger av forskjellige grunner. La oss nevne noen eksempler: Man kan registrere flere datapunkter fra samme individ, slik at individet utgjør «gruppen». Dette er tilfelle hvis man har gjentatte målinger av samme utfallsvariabel, enten flere parallelle målinger fra samme tidspunkt eller data fra longitudinelle studier. I andre studier kan data fra samme individ...

Prosenter på kryss eller tvers?

Medisin og tall

09.09.2024: Når man skal rapportere antall og sammenlikne andeler, kan det være nyttig å vise tallene i en krysstabell. Men bør man rapportere prosenter innen rader eller innen kolonner? For å besvare dette spørsmålet kan man spørre seg hva som er eksponering og hva som er utfall, og rapportere prosentandeler innenfor hver gruppe av eksponering. Vanligvis vil det være naturlig å vise eksponering i rader, og dermed også prosenter innen rader (1, s.85). Eksponering eller utfall? La oss se på et eksempel. Gårdvik og medarbeidere rapporterer resultater fra en oppfølgingsstudie av personer tre år etter at de...

Utvalgsstørrelse for en prediksjonsmodell

Medisin og tall

14.08.2024: Pasienter spør ofte legen om risikoen for nåværende eller fremtidig sykdom. I tillegg til medisinsk kunnskap og klinisk erfaring, er kliniske prediksjonsmodeller et viktig verktøy for både diagnose og prognose. Kliniske prediksjonsmodeller hjelper til med å forutse helseutfall eller helsetilstander. Disse modellene kan variere fra enkle trafikklyslignende metoder til komplekse «svart boks»-matematiske modeller og maskinlæring (1). Ofte brukes klassiske statistiske metoder som lineær, logistisk eller Cox-regresjon. Prediksjonsmodeller utviklet fra datasett med få deltagere, kan medføre ustabile...

De trøblete brøkene

Medisin og tall

23.05.2024: Helsevesenet er fullt av tall, og en god tallforståelse er viktig for å kunne ta riktige avgjørelser for både egen og andres helse. Men noen tall er vanskeligere å forstå enn andre. Hjernen har en medfødt forståelse for grunnleggende matematikk – de fleste pattedyr vet hvor mange barn de har. Men mens de fleste kan lære seg mengder og telling, så er forholdstall verre. Og det er kanskje ikke så rart. For mens man kan dele to tall på hverandre og få et nytt, meningsfullt tall, så kan man ikke dele to ord på hverandre, eller dele en katt på en elg og få et nytt dyr. Å forstå forholdstall er en...

Kasus–overkrysningsstudier

Medisin og tall

25.02.2024: En kasus–overkrysningsstudie kan brukes til å undersøke om en viss eksponering øker risikoen for en akutt hendelse. Personer som har opplevd hendelsen, blir inkludert i studien. Så registrerer man grad av eksponering i tidsintervallet rett før hendelsen, og i ett eller flere tidligere tidsintervaller. I en vanlig kasus–kontroll-studie innhenter man data fra personer som er kasus, altså som har opplevd hendelsen, samt fra kontrollpersoner som ikke har opplevd hendelsen. Så registrerer man hvem som har vært eksponert i de to gruppene (1). I en kasus–overkrysningsstudie, derimot, innhentes data...

Statistisk analyse av én enkelt pasient

Medisin og tall

01.02.2024: I en kasusstudie undersøker vi behandlingseffekten til én enkelt deltager. Med gjentatte målinger, visuell vurdering av dataene og skarpsindige effektmål kan vi si mye om den enkelte. Medisinske fremskritt skjer ofte takket være forskning med mange deltagere, typisk randomiserte multisenterstudier og befolkningsundersøkelser med langtidsoppfølging. Historien gir likevel flere eksempler på at sykdoms- og behandlingsforløp til et enkeltindivid (kasus) har endret medisinsk vitenskap og behandling. Kasusstudier er spesielt viktige der antallet forsøkspersoner eller -dyr som kan inkluderes, er lavt...

Avhengig sensurering

Medisin og tall

02.01.2024: I studier av overlevelse følges sjelden alle deltakerne til de dør. Metoder for levetidsanalyse er konstruert for å håndtere slike ufullstendig observerte levetider. Vi kaller disse levetidene sensurerte. Standardmetoden for levetidsanalyse antar at sensureringstidene er uavhengige av levetidene. Når er denne antagelsen brutt? Og hva gjør vi da? Anta at noen individer i en studie ikke har opplevd en gitt hendelse, for eksempel død, ved studiens slutt. Disse individene er rammet av administrativ sensurering. Slik sensurering vil ofte være uavhengig; de sensurerte skiller seg ikke fra de...

Hvor ofte er aldri?

Medisin og tall

05.12.2023: Vi bruker ord for å beskrive usikkerhet og sannsynlighet hele tiden. Samtidig er vi ofte svært uenige om hva disse ordene faktisk betyr. I mars 1951 publiserte den amerikanske etterretningsorganisasjonen CIA et dokument som antydet at et sovjetisk angrep på Jugoslavia var en «seriøs mulighet» (1). Historieprofessor Sherman Kent (1903–86) var forvirret over hva en «seriøs mulighet» innebar. Selv tolket han det som at sjansen for et angrep var omtrent 65 prosent, men når han forhørte seg rundt, fikk han tall som varierte fra 20 til 80 prosent. Et så stort spenn var åpenbart et problem, siden de...

Konkurrerende hendelser

Medisin og tall

20.11.2023: En konkurrerende hendelse er en hendelse som gjør det umulig for utfallet å finne sted. I analyser av kliniske og epidemiologiske data må vi ofte ta stilling til slike hendelser. Valgene vi tar, kan ha store konsekvenser for fortolkningen av resultatene. Hvordan vi håndterer konkurrerende hendelser i statistiske analyser, avhenger hva slags data vi samler inn og hva vi definerer som primærutfall. Anta at vi er interessert i tid til død for en gruppe innlagte pasienter. Hvis vi bare har data fra sykehusoppholdet, kan vi se på død under sykehusoppholdet som primærutfall. Da blir utskrivinger...

Kostnadseffektivitetsanalyse: et rammeverk for prioriteringskriteriene

Medisin og tall

30.10.2023: Norge har lenge hatt en åpen offentlig debatt rundt prioritering i helsetjenesten. De gjeldende prioriteringskriteriene er nytte, ressursbruk og alvorlighet. Disse operasjonaliseres gjennom kostnadseffektivitetsanalyser. I Norge ble prioritering for alvor satt på agendaen i 1987 med Lønning-utvalget (1). I påfølgende utvalg, som Lønning II-utvalget, Nordheim-utvalget, Magnussen-gruppen og Blankholm-utvalget, ble det lagt føringer for, og gjennom Prioriteringsmeldingen bestemt, at kriteriene som skal legges til grunn ved prioritering i spesialisthelsetjenesten og i de kommunale pleie- og...

Avbrutte tidsserieanalyser

Medisin og tall

02.10.2023: Når man skal teste effekten av helsetjenesteintervensjoner, er det ikke alltid mulig å gjennomføre randomiserte kontrollerte studier. Avbrutte tidsserieanalyser regnes som et godt alternativ. Randomiserte kontrollerte studier er gullstandarden for å vurdere effekten av en intervensjon, men det er ikke alltid mulig å gjøre slike studier. Dette vil særlig gjelde for intervensjoner på et populasjons- eller systemnivå. Avbrutte tidsserieanalyser (engelsk: interrupted time series) har vært brukt til å analysere effekt av tiltak for å oppnå endret forskrivning fra leger, som opplæringsprogram på...

Statistisk lærdom fra en laks

Medisin og tall

22.09.2023: Craig Bennett kunne ikke tro det han så. I hånden holdt han et bilde som viste hjerneaktiviteten til en laks, der tre statistisk signifikante prikker lyste mot ham – et tydelig tegn på at de hadde oppdaget noe banebrytende i forholdet mellom laks og mennesker. Eller så var det noe galt med statistikken. På laben der Bennett jobbet, skulle de undersøke beslutningstaking hos mennesker ved hjelp av funksjonell magnetisk resonanstomografi (fMRI), en metode der man skanner hjernen ved å måle endringer i oksygeneringsnivået i blodet (1). Først måtte utstyret kalibreres, og de unge akademikerne...

Overlevelsesanalyser og strategier for sensurering

Medisin og tall

24.07.2023: Når man estimerer overlevelse i en klinisk studie, må man ikke glemme betydningen av hvordan ufullstendige observasjonstider sensureres. Ulike sensureringsregler gir svar på ulike spørsmål. De fleste kliniske studier har for kort varighet til at man kan observere den hendelsen man er interessert i, hos alle pasientene som er inkludert, og noen observasjonstider sensureres (1). Administrativ sensurering inntreffer når studien avsluttes, og dette er uproblematisk dersom observasjonstiden er tilstrekkelig lang. Mer problematisk er håndtering av pasienter som sensureres før studieslutt uten at den...

Utradisjonelle forsøksplaner

Medisin og tall

26.06.2023: Når man studerer små utvalg, kan det av og til være hensiktsmessig å bruke adaptive forsøksplaner eller bayesianske statistiske metoder. Noen ganger er det vanskelig eller umulig å gjøre en tilstrekkelig stor klinisk studie, f.eks. ved utprøving av legemidler mot sjeldne sykdommer. Selv om vi forsøker å hente mest mulig informasjon med optimal planlegging og analyse av data, er tilpasninger av tradisjonelle forsøksplaner og et pragmatisk forhold til p-verdier ikke alltid nok (1). Da kan det være hensiktsmessig å tenke «utenfor boksen» om valg av studiedesign og statistisk analyse (2)...

Penger, prinsipper og prioritering

Medisin og tall

12.06.2023: Helsetjenestekostnadene øker stadig. Er denne økningen problematisk? Og hvorfor bruker vi kostnad-effekt-analyser i prioriteringen av helsetjenester? Helsetjenestekostnaden per person økte fra 58 300 kr i 2011 til 64 600 kr i 2021 i faste 2015-priser (1). Hva skyldes denne økningen? Økt etterspørsel Økt inntekt øker etterspørselen etter helsetjenester. Når vi blir rikere, ønsker vi mer av såkalte normale goder: litt finere hjem, litt bedre bil og helse- og omsorgstjenester med litt bedre kvalitet. Videre utvider teknologisk utvikling grunnlaget for hvem som får helsetjenester. Vi screener for...

Maskinlæring i medisinsk forskning

Medisin og tall

29.05.2023: Maskinlæring brukes til å finne underliggende mønster i data. Dette kan være nyttig i medisinsk forskning. Maskinlæring er en form for kunstig intelligens og brukes til finne underliggende mønster i data. Maskinlæring kan bygge på statistiske metoder eller andre metoder fra matematikk eller informatikk som ikke legger en sannsynlighetsmodell til grunn. Maskinlæring er spesielt nyttig når man har store datasett med mange variabler, og læringen innebærer å trene opp en modell for å finne sammenhenger mellom variablene. Ofte er hensikten å bygge en modell som kan predikere et utfall. Et typisk...