Welkom bij het practicum statistiek, week 1!

Hier kun je de verschillende opdrachten vinden die horen bij week 1. Succes!

Meerdere steekproeven trekken

Vervolgens trekken we niet één, maar vele steekproeven, en we 'plotten' de steekproefgemiddelden. In dit geval zullen we het aantal steekproeven gaan variëren om te kijken wat de gevolgen zijn voor het schatten van het populatiegemiddelde. Wat ook varieert is de grootte van de steekproeven; in dit geval óf n=5, óf n=25, óf n=50.

Vraag 3a

Trek 10 steekproeven (gebruik Figuur 3), en bekijk het gemiddelde van de steekproefgemiddelden (de blauwe stippel-lijn) in de drie grafieken (elk met een andere steekproefgrootte). Doe dit nogmaals voor 10 steekproeven. En nogmaals. Beschrijf wat er gebeurt met het gemiddelde van de steekproefgemiddelden in de drie grafieken.

Vraag 3b

Trek een groot aantal steekproeven (groter dan 100) en beschrijf de verschillen in de standaarddeviatie van de steekproefgemiddelden bij de verschillende steekproefgroottes (n=5, n=25, en n=50).

Vraag 3c

De standaardfout van het gemiddelde van een (willekeurige) steekproef met steekproefgrootte n uit een populatie met gemiddelde μ en standaarddeviatie σ kan berekend worden via (Boek: p. 90-91): $$σ_\ov y =σ/√{n}$$ Bereken de standaardfout voor de drie verschillende steekproefgroottes. [Voor gegevens over de populatie, zie het tabblad "De populatie" in Figuur 3]. Vergelijk deze getallen met de standaarddeviaties in de grafieken. Leg uit wat een grote standaarddeviatie (dan wel grote standaardfout) zegt over het schatten van het populatiegemiddelde.

$σ_\ov y $ is de standaarddeviatie van de steekproevenverdeling van het steekproefgemiddelde ($\ov y$) en wordt wel de standaardfout genoemd. (Boek: p. 90-91)

Belangrijk

Een assumptie van de formule van de standaardfout is dat de populatie grootte N oneindig groot is ten opzichte van de steekproefgrootte n. Dat is hier duidelijk niet het geval, en dit is de reden dat de uitkomsten van de formule licht afwijken van de geobserveerde standaardfout (wordt overschat).

Ga verder met de volgende opdracht

Ga terug naar de vorige opdracht
Figuur 3. De rode gestippelde lijn geeft het gemiddelde van de populatie aan. De blauwe gestippelde lijn is het gemiddelde van de verschillende steekproefgemiddelden. De standaarddeviatie van de verschillende steekproefgemiddelden wordt weergegeven met $σ_\ov y $.