Welkom bij het practicum statistiek, week 1!

Hier kun je de verschillende opdrachten vinden die horen bij week 1. Succes!

Schatting van de variatie in de populatie

In de voorafgaande opdracht, hebben we gezien dat het schatten van het gemiddelde, zelfs bij kleine steekproefgroottes aardig accuraat is. We gaan nu kijken of het schatten van de variatie in de populatie ook zo goed geschat kan worden. De variatie in de populatie wordt op de volgende manier berekend: $$σ^2={∑↙{i=1}↖N=(x_i-μ)^2}/N$$

Vraag 4a

Trek 1000 steekproeven, en varieer de steekproefgrootte van n=2,n=3, ..., n=10, en schrijf de mate van schattingsfout ("bias") op die gevonden wordt door $\ov {σ^2↖{`∧}}/σ^2$ (zie legenda Figuur 4) in de bovenste grafiek (het dakje ^ staat voor "geschat"; zie p. 109). Is $σ^2↖{`∧}={∑↙{i=1}↖n=(y_i- \ov y)^2}/n$ een zuivere schatter voor de populatievariatie $σ^2$?

Vraag 4b

Trek nu 2,3,4,5,6,7,8,20, en 1000 steekproeven van steekproefgrootte n=25, en beschrijf wat er gebeurt met het schatten van de populatievariatie in de bovenste grafiek.

Vraag 4c

Beantwoord nu hetzelfde voor de onderste grafiek, waar de steekproefvariatie geschat wordt door $s^2={∑↙{i=1}↖n=(y_i- \ov y)^2}/(n-1)$. Wat kun je zeggen over deze schatter van de populatievariatie?

$s^2={∑↙{i=1}↖n=(y_i- \ov y)^2}/(n-1)$ is een zuivere schatter voor de populatievariatie (Dit staat niet in het boek maar is wel belangrijk! Dit is dus een verklaring waarom men door n-1 deelt in plaats van door n. De formule op pagina 47 deelt al door n-1, en het is dus ook goed om te realiseren dat het hier de variatie/standaard deviatie van een steekproef betreft!)

Ga verder met de volgende opdracht

Ga terug naar de vorige opdracht
Figuur 4. De rode lijn geeft de variatie in de populatie aan ($σ^2$=44.9). De blauwe lijn geeft het gemiddelde weer van de steekproefvariaties. In de bovenste grafiek wordt de steekproefvariatie bepaald door de formule: $σ^2↖{`∧}={∑↙{i=1}↖n=(y_i- \ov y)^2}/n$, terwijl in de onderste grafiek de steekproefvariatie wordt bepaald door: $s^2={∑↙{i=1}↖n=(y_i- \ov y)^2}/(n-1)$. De getallen $\ov {σ^2↖{`∧}}/σ^2$ en $\ov {s^2}/σ^2$ geven weer hoe dicht het gemiddelde van de steekproefvariaties bij de populatievariatie zit. Een getal van 0.7 betekent bijvoorbeeld dat de steekproefvariatie slechts 70% van de grootte van de populatievariatie is, en de populatievariatie sterk onderschat wordt.