Et enkelt eksempel
Anta at vi har registrert antall dager på sykehus for 13 pasienter med en gitt diagnose (hhv. 3, 9, 10, 10, 10, 12, 13, 14, 18, 21, 27, 38 og 62 dager). Hvis vi ønsker å estimere kostnad eller behov for personell, er gjennomsnittet en mer interessant parameter enn medianen. Fordelingen er vist i figur 1. Den er klart høyreskjev, og gjennomsnittet er 19 dager. Vi kan enkelt estimere et parametrisk 95 %-konfidensintervall for gjennomsnittet (9,46 til 28,54), men en tradisjonell fremgangsmåte antar normalfordelte observasjoner. Selv om prosedyren er robust mot små avvik, er det ikke opplagt at tilnærmingen er god når vi har så få observasjoner som her.
Hvis vi i stedet benytter bootstrapping, trekker vi 13 observasjoner, med tilbakelegging, fra de 13. Et mulig ordnet utfall er 3, 9, 10, 10, 13, 13, 14, 14, 14, 21, 27, 27, 27. Legg merke til at samme observasjon kan gjentas flere ganger, mens andre ikke blir trukket ut. I akkurat dette utvalget blir gjennomsnittet 15,54. I alt trekker man B utvalg. I figur 2 vises fordelingen til B = 5 000 gjennomsnitt, hvert av dem basert på n = 13 uttrukne observasjoner. Gjennomsnittet av disse 5 000 gjennomsnittene er 19,05. Skjevheten (19,05 − 19,00 = 0,05) er altså liten.
Standardavviket til de 5 000 gjennomsnittene er 4,24. Dette er et ikke-parametrisk bootstrap-estimat av standardfeilen. Mange statistikkpakker benytter dette til å estimere et 95 %-konfidensintervall for gjennomsnittet på vanlig måte (x̄ ± z0,025 ∙ SE = 19 ± 1,96 ∙ 4,24). Resultatet blir 10,69 til 27,31 – et mer robust estimat enn det enkle, parametriske estimatet vi fikk over. Merk at en ny simulering ville gitt et litt annet resultat. En ulempe med bootstrapping er usikkerheten i grensene i konfidensintervallet. Denne unngås når man gjør en fordelingsantagelse.