Effekt av behandling
Når en tilbøyelighetsskår er estimert for hvert individ, er neste trinn selve analysen av utfallet. Denne kan utføres ved matching, stratifisering, justering eller invers sannsynlighetsvekting.
Ved matching sammenlignes individer med samme eller tilnærmet samme skår. Det vanligste er å matche én-til-én, men data kan utnyttes bedre ved å matche flere til én. Matching er den metoden som best reduserer skjevheter, og den er mest brukt (2). Den største ulempen med matching er at individer kan mangle en «match» og derfor ikke kan inkluderes i analysen. Dette reduserer presisjon i estimatene og, kanskje enda viktigere, ekstern validitet. Figur 1 viser en situasjon der det er stor forskjell i fordelingen av skår mellom de to gruppene, slik at mange individer i begge gruppene må ekskluderes.
Stratifisering ligner matching, men her deles skårene inn i et antall strata som avhenger av antall individer som er med i studien. Fordelen med stratifisering er at man kan inkludere alle individene, men metoden er ikke like god til å redusere systematiske skjevheter som matching.
En enkel tilnærming ville være å justere for tilbøyelighetsskår i en vanlig regresjonsanalyse, men med en slik strategi kunne man like gjerne ha gjort en multivariabel analyse der man justerte for alle de konfunderende faktorene samtidig. Det er altså lite å vinne, bortsett fra hvis utfallet er sjeldent og utvalgsstørrelsen for liten til at man kan justere for tilstrekkelig mange kovariater. Den viktigste grunnen til ikke å velge justering er likevel at den i mindre grad enn de andre strategiene vil redusere systematiske skjevheter (2).
En ytterligere metode er å vekte pasienter i de to gruppene med den inverse verdien av skårene. Slik vekting svarer til metoder for spørreundersøkelser der man vekter deltagere slik at utvalget skal bli representativt for populasjonen man studerer. Et individ med høy skår vil vektes mindre i analysen enn et individ med lav skår. Fordelene er at hele datasettet utnyttes, og at metoden reduserer skjevhet i estimatene bedre enn både stratifisering og justering. Ulempen er at den er mer sensitiv for feilspesifisering av modellen (2).