Welkom bij Statistiek 1b!

Betrouwbaarheidsintervallen van proporties

We zagen bij de vorige opdracht dat bij een groot aantal steekproeven met een grote steekproefgrootte, de steekproevenverdeling steeds meer begint te lijken op een normale verdeling. Precies zoals de centrale limietstelling stelt. Dit idee gaan we nog verder door voeren: De drie figuren (abc) waarnaar gelinked wordt bij Figuur 3 geven de steekproevenverdeling van 10000 steekproeven met steekproefgrootte 10000 weer.

De standaardfout van een steekproefproportie $π↖{`∧}$ kan geschat worden met behulp van de formule (Boek: p. 111): $$σ_{π↖{`∧}}= √{{π↖{`∧}(1-π↖{`∧})}/n}$$

Vraag 2a

Bereken de standaardfout van de proportie in de steekproef van steekproefgrootte 10000. Vergelijk deze met de standaarddeviatie van de steekproevenproporties in Figuur 3.

Vraag 2b

Bekijk de drie varianten (a, b, c) van Figuur 3 en beschrijf de verschillen.

Gebaseerd op deze vraag en de vorige, kunnen we het volgende concluderen:

De breedte van een betrouwbaarheidsinterval wordt: 1) groter wanneer het betrouwbaarheidsniveau groter wordt; 2) kleiner wanneer de steekproefgrootte groter wordt. (Boek: p. 115)

Vraag 2c

Bereken het 90% betrouwbaarheidsinterval, en baseer je op de Z-waarden uit de onderste grafiek. Komt je betrouwbaarheidsinterval overeen met die van de steekproevenverdeling?

Vraag 2d

Je hebt een steekproef getrokken met als steekproefproportie 52%, en je hebt met een vrij grote zekerheid mogen concluderen dat Obama de meerderheid van de stemmen had; dat wil zeggen, het 95% betrouwbaarheidsinterval bevatte niet de 50%. Hoe groot was de steekproef?

Ga verder met de volgende opdracht

Ga terug naar de vorige opdracht

Figuur 3a: 90% betrouwbaarheidsinterval

Figuur 3b: 95% betrouwbaarheidsinterval

Figuur 3c: 99% betrouwbaarheidsinterval

Figuur 3abc. Bekijk alle drie de figuren door op de links te drukken. In de bovenste grafiek is telkens de steekproevenverdeling te vinden van 10000 steekproefproporties, elk met een steekproefgrootte van 10000. De rode lijn is de normaalverdeling behorende bij het gemiddelde en de standaarddeviatie van deze steekproefgemiddelden. De rode gestippelde lijn geeft het gemiddelde van de populatie aan. De onderste grafiek geeft de standaardnormaal verdeling. De berekening van een betrouwbaarheidsinterval gebeurt bij proporties en grote steekproefgroottes op basis van Z-waarden waartussen het oppverlakte onder de curve gelijk is aan het gewenste betrouwbaarheidsniveau.

Welkom bij het practicum statistiek, week 2!

Betrouwbaarheidsintervallen van proporties

Vraag 2a

Vraag 2b

Vraag 2c

Vraag 2d