Krysstabell – ikke kontingenstabell

Stian Lydersen, Eirik Skogvoll Om forfatterne
Artikkel

Krysstabell er et godt norsk ord for den engelske termen contingency table.

Illustrasjon: Tidsskriftet

En kategorisk variabel er en variabel som bare kan anta et endelig antall verdier. Eksempler er behandlingsgruppe i en randomisert kontrollert studie, en sykdom som kan diagnostiseres som til stede eller ikke, og blodtype klassifisert som A, B, O eller AB.

Tabell 1 viser antall observasjoner for hver kombinasjon av de to kategoriske variablene røyker og lungekreft, fra en artikkel publisert av Doll og Hill i British Medical Journal i 1950 (1). Forfatterne innhentet data fra 709 sykehuspasienter som hadde diagnosen lungekreft, og av disse var 688 røykere. Det ble også innhentet data fra 709 sykehuspasienter som ikke hadde lungekreft, og 650 av disse var røykere. Datasettet som er vist i tabell 1, er nylig analysert i to artikler i Tidsskriftet (2, 3).

Tabell 1

Eksempel på en toveistabell som viser pasienter med lungekreft versus andre pasienter (1).

Eksponering

Lungekreft

Andre sykdommer

Sum

Røyker

688

650

1 338

Ikke-røyker

21

59

80

Sum

709

709

1 418

Tabell 1 viser en toveistabell ettersom det er to variabler: røyking og lungekreft. Dette er en 2×2-tabell, da både radene og kolonnene kan ha to verdier. Dersom eksponering var klassifisert i tre grupper, for eksempel røyker, tidligere røyker og aldri røyker, ville vi fått en 3×2-tabell. Og noen ganger er det aktuelt å analysere høyere ordens tabeller, for eksempel en treveistabell dersom tabell 1 ble splittet i menn og kvinner (en tredje variabel).

På engelsk kalles en slik tabell for contingency table eller cross-tabulation (4). En av betydningene til contingent er ifølge Merriam-Webster Dictionary ‘avhengig av eller betinget av noe annet’ («dependent on or conditioned by something else») (5). Muligens er dette forklaringen til at man tok i bruk contingency table på engelsk: Tabellen kan tenkes å vise fordelingen av den andre variabelen betinget av verdien av den første. Termen skal ha blitt brukt første gang i 1904 av den britiske statistikeren Karl Pearson (1857–1936) (6).

Krysstabell

Hva bør contingency table hete på norsk? Termen kontingenstabell er noe brukt, blant annet i lærebøker av Arnljot Høyland (1924–2002) (7) og Gunnar Løvås (8). Enkelte statistikklærebøker rettet mot medisinske fag bruker imidlertid krysstabell (9, 10), slik det også gjøres i spalten Medisin og tall i Tidsskriftet (2, 3). Søkestrengene «kontingenstabell» og «krysstabell» gir henholdsvis 0 og 51 treff på tidsskriftet.no (16.9.2020), og 71 og 1 148 i Nasjonalbibliotekets digitale samling (16.9.2020). Krysstabell er altså klart mest brukt i praksis.

Godt norsk fagspråk bør være både presist og intuitivt, med betydning som ligger så tett opp til daglig bruk og forståelse som mulig. Krysstabell er mye brukt og godt innarbeidet. Termen kontingens, som inngår i kontingenstabell, har ingen relevant betydning på norsk i denne forbindelse. Vi mener at krysstabell er en god norsk term for denne typen tabeller, og at kontingenstabell bør unngås.

Anbefalte artikler