Welkom bij het practicum statistiek, week 2!

Hier kun je de verschillende opdrachten vinden die horen bij week 2. Succes!

Betrouwbaarheidsintervallen van proporties

We zagen bij de vorige opdracht dat bij een groot aantal steekproeven met een grote steekproefgrootte, de steekproevenverdeling steeds meer begint te lijken op een normale verdeling. Precies zoals de centrale limietstelling stelt. Dit idee gaan we nog verder door voeren: Figuur 3 geeft de steekproevenverdeling van 10000 steekproeven met steekproefgrootte 10000.

De standaardfout van een steekproefproportie $π↖{`∧}$ kan geschat worden met behulp van de formule (Boek: p. 111): $$σ_{π↖{`∧}}= √{{π↖{`∧}(1-π↖{`∧})}/n}$$

Vraag 2a

Bereken de standaardfout van de proportie in de steekproef van steekproefgrootte 10000. Vergelijk deze met de standaarddeviatie van de steekproevenproporties in Figuur 3.

Vraag 2b

Varieer het niveau van betrouwbaarheid in Figuur 3, en beschrijf wat er gebeurt.

Gebaseerd op deze vraag en de vorige, kunnen we het volgende concluderen:

De breedte van een betrouwbaarheidsinterval wordt: 1) groter wanneer het betrouwbaarheidsniveau groter wordt; 2) kleiner wanneer de steekproefgrootte groter wordt. (Boek: p. 115)

Vraag 2c

Bereken het 90% betrouwbaarheidsinterval, en baseer je op de Z-waarden uit de onderste grafiek. Komt je betrouwbaarheidsinterval overeen met die van de steekproevenverdeling?

Vraag 2d

Je hebt een steekproef getrokken met als steekproefproportie 52%, en je hebt met een vrij grote zekerheid mogen concluderen dat Obama de meerderheid van de stemmen had; dat wil zeggen, het 95% betrouwbaarheidsinterval bevatte niet de 50%. Hoe groot was de steekproef?

Ga verder met de volgende opdracht

Ga terug naar de vorige opdracht
Figuur 3. In de bovenste grafiek is de steekproevenverdeling te vinden van 10000 steekproefproporties, elk met een steekproefgrootte van 10000. De rode lijn is de normaalverdeling behorende bij het gemiddelde en de standaarddeviatie van deze steekproefgemiddelden. De rode gestippelde lijn geeft het gemiddelde van de populatie aan. De onderste grafiek geeft de standaardnormaal verdeling. De berekening van een betrouwbaarheidsinterval gebeurt bij proporties en grote steekproefgroottes op basis van Z-waarden waartussen het oppverlakte onder de curve gelijk is aan het gewenste betrouwbaarheidsniveau.