Kommentar

Ikke glem «total sum of squares»

Arne Høiseth
Pensjonist
Interessekonflikt:  No

Noen av de forhold som Lydersen trekker frem (1) ble omtalt i Tidsskriftet allerede i 1990 (2). Det ble da påpekt at korrelasjonskoeffisienten (R) ble feilaktig benyttet til å beskrive overensstemmelser og målepresisjon. Bruken av R er mindre nå, sannsynligvis betinget i erkjennelse av slike feilanvendelser.

I Lydersens redegjørelse utelukkes en viktig detalj i figur 1, nemlig at R beregnes ved å kalkulere ratio mellom «summen av kvadratet av residualene» (s2) og «total sum of squares» (TSS) som i Lydersens eksempel vil være summen av kvadrerte differanser mellom de enkeltes vekt og gjennomsnitt vekt, i 1990 benevnt ρ2. R beregnes da slik: r2 = 1- s2/ ρ2; R = √r2.

Ved inndeling i undergrupper forskyves gjennomsnittet på vekten slik at differansene mellom de målte verdier og verdienes gjennomsnitt endres. Dessuten, ved inndeling i undergrupper blir spredningen rundt gjennomsnittet mindre. Disse effekter på ρ2 er det sannsynligvis viktigst å være klar over. Skovlund benevner r2 «forklart varians» (3), også i hennes redegjørelse er betydningen av ρ2 utelatt.

Før 1990 var vi klar over disse forhold og sikret oss høye R-verdier ved hvordan vi selekterte våre objekter. Juks? Ja, men med R<0.6 var det vanskelig å få arbeidene publisert.

Litteratur:

1. Lydersen S. Korrelasjon er relativ. Tidsskr Nor Legeforen 2020; 140. 1672.
2. Høiseth A. Er statistiske analysert egnet ved vurdering av målinger. Tidssk Nor Lægeforen 1990; 110: 1968-71.
3. Skovlund E. Enkel lineær regresjon. Tidsskr Nor Legeforen 2020; 140. 1566.

Published: 10.11.2020
Laget av Ramsalt med Ramsalt Media