Kommentar

Gammel problemstilling i ny drakt

Arne Høiseth
Pensjonist
Interessekonflikt:  Nei

Problemstillingen som S. Lydersen (1) diskuterer oppsto sannsynligvis sent på 1960-tallet da «signifikans» ble del av medisinsk forskning. Kunne man si at noe var «signifikant» var publikasjonen sikret.
Signifikans kunne oppnås ved forskjellige knep, ofte benevnt "fisking". Data kunne «tortureres» (2), antall observasjoner kunne økes til signifikans oppsto, økt spredning på objektene økte sjansen for en signifikant korrelasjonsfaktor (R), og - jo flere spørsmål eller hypoteser, jo større var sjansen for å finne noe signifikant. For å hindre slik fisking ble det tillatt med kun ett spørsmål per studie, eller ett hovedspørsmål og noen bi-spørsmål. Regionale komiteer for medisinsk og helsefaglig forskningsetikk (REK) krevde at antall observasjoner skulle bestemmes på forhånd. Lydersen beskriver ytterligere et alternativ, nemlig en matematisk økning av p-verdien med økende antall problemstillinger.
Hvis man mener at p-verdier sier noe av betydning må man benytte p-verdien, ikke en omregnet verdi. Hadde, for eksempel t-tester, med beregninger av p-verdier, vært avhengige av hverandre, ville en justering for avhengighet vært berettiget, ellers ikke. T-testene vil imidlertid være uavhengige og beskriver en unik egenskap for hver problemstilling. Den egenskapen bør presenteres uansett om den fremkommer i en studie med kun n hypotese eller med mange.
For oss leger er imidlertid spørsmålene: Hvilke assosiasjoner, parvise forskjeller, gruppevis forskjeller og så videre kan være av medisinsk betydning? I 2013 ble problemet diskutert av E Skovlund som påpekte at et effektestimat gir vesentlig mer informasjon enn en p-verdi (3). Spørsmålet blir da om man kan sløyfe p-verdiene, men beholde t-verdiene eller kun benytte lokalisasjon og spredningsparametere?
I stigende grad kan vi forvente studier basert på «big data». Utvikling av «En innbygger - en journal» kan bidra til en slik utvikling. Da kan antallet lave p-verdier gå i været. Sannsynligvis vil det være andre enn oss, leger, som utfører slike analyser. Da kan det være viktig at vi behersker relevante premisser, ikke bare for betydningsfullhet, men at vi også for å skille mellom assosiasjon og årsak-virkning.

Litteratur:

1 Lydersen S. Justering av p-verdier ved multiple hypoteser. Tidsskr Nor Legeforen 2021
doi: 10.4045/tidsskr.21.0357

2 Mills JL. Data torturing. N Engl J Med 1993; 329: 1196-9.

3 Skovlund E. Spør først, regn siden. Tidsskr Nor Legefoen 2013; 133:10. doi: 10.4045/tidsskr.12.1345

Published: 01.10.2021
Laget av Ramsalt med Ramsalt Media