Leselig murstein om ikke-parametrisk statistikk

Artikkel

Denne boken ble første gang utgitt i 1973 og finnes ofte som generell referanse i mer grunnleggende lærebøker. Begrepet ”ikkeparametrisk” benyttes litt upresist om statistiske metoder som ikke forutsetter at datamaterialet har noen bestemt sannsynlighetsfordeling, f.eks. normalfordeling. Et eksempel er Mann-Whitney’s test for to uavhengige utvalg, der det er rekkefølgen og relativ størrelse av observasjonene som er gjenstand for analyse og ikke verdiene i seg selv.

Forfatterne fremhever at ikke-parametriske metoder har fordeler fremfor parametriske, bl.a. ved å være lette å forstå, være lite følsomme for ekstreme observasjoner (”outliers”) og i mange tilfeller gjøre det mulig å beregne p-verdien eksakt. Da medisinske data ofte kan omfatte få observasjoner og det kan være usikkert om de ”egentlig” er normalfordelte, har ikke-parametriske metoder en viktig plass i medisinsk statistikk.

Boken er meget omfattende og systematisk oppbygd. Den er problem- og eksperimentelt orientert og tar utgangspunkt i de fleste alminnelige forsøksvarianter: Ett utvalg, to utvalg og flere enn to utvalg, enveis og toveis design, uavhengighet og korrelasjon samt mål på sammenheng/uavhengighet mellom kategoriske variabler. Både estimering, hypotesetesting og beregning av konfidensintervall omtales. Nye kapitler i denne utgaven omfatter bl.a. ikke-parametriske metoder for overlevelsesanalyse og regresjon.

Hvert kapittel inneholder introduksjon, problemstilling, nødvendige forutsetninger, praktisk fremgangsmåte, tolking av resultatet, bruk av det omfattende tabellverket (hele 180 sider!) og normaltilnærming ved tilstrekkelig mange observasjoner. Ikke minst diskuteres hva man skal gjøre hvis det er mange ”ties” (sammenfallende verdier) i datamaterialet. Til hver prosedyre finnes minst ett eksempel, hvorav mange er medisinske. Til slutt følger kommentarer med tilleggsinformasjon som ofte trekker linjene til utfyllende litteratur. Effektiviteten av de omtalte ikke-parametriske prosedyrer er som regel sammenliknet med tilsvarende prosedyrer basert på normalfordeling.

Den nødvendige bakgrunn for å ha nytte av boken angis å være et ”introductory course” eller litt mer i statistikk. Kjennskap til og erfaring med matematisk notasjon og sentrale begreper som sannsynlighetsfordeling, forventningsverdi, varians osv. er påkrevd. På den annen side gjøres minimal bruk av integral- og matriseregning. Matematiske bevis er som regel bare skissert, men med litteraturhenvisning. Bruk av programvare er illustrert gjennom eksempler fra StatXact og Minitab. En merkverdighet er at ordliste og definisjoner bare er tilgjengelig via forlagets hjemmeside www.wiley.com, og i det temmelig eksotiske LaTex-formatet. Med litt hjelp lar det seg likevel konvertere.

Dette er en meget innholdsrik og faktisk ganske lettlest bok. Uten at anmelderen har hatt ambisjoner om – eller særlig kompetanse til – å oppdage feil, virker den meget solid og gjennomarbeidet. Selv om de fleste medisinske forskere antakelig nøyer seg med det som står om ikke-parametriske metoder i vanlige introduksjonsbøker, må denne boken være et meget bra valg for dem som ønsker å gå noen skritt videre. Boken er velegnet som referanse, og bør kunne finnes i hyllene på de medisinske bibliotek.

Eirik Skogvoll

Institutt for samfunnsmedisinske fag

Norges teknisk-naturvitenskapelige universitet

Trondheim

Anbefalte artikler