Welkom bij het practicum statistiek, week 1!

Hier kun je de verschillende opdrachten vinden die horen bij week 1. Succes!

Schatting gemiddelde en mediaan

Wat gebeurt er eigenlijk met het schatten van het populatiegemiddelde, wanneer de populatie niet normaal verdeeld is? En hoe verhouden het schatten van het gemiddelde en de mediaan zich tot elkaar? In Figuur 4 (tabblad: "De populatie"") zien we drie sterk verschillende verdelingen. De eerste verdeling is een normaalverdeling, de tweede verdeling is een bimodale verdeling (het heeft twee pieken!), en de derde verdeling is een soort van lineaire verdeling. De populaties zijn zeer verschillend, maar ze hebben allen een grootte N van 1000, en een populatiegemiddelde van μ van 50. In de tabbladen "Gemiddelde" en "Mediaan" kunnen we zien wat het trekken van een steekproeven van verschillende grootte ten gevolg heeft voor het schatten van deze parameters. We kunnen ook het aantal steekproeven variëren.

Vraag 5a

Trek 1000 steekproeven van steekproefgrootte n=50 en bekijk de verschillende steekproevenverdelingen bij het schatten van het gemiddelde (tabblad: "Gemiddelde"). Beschrijf wat je ziet. Vind je de verdelingen normaal verdeeld?

De centrale limietstelling (central limit theorem) stelt dat voor willekeurige steekproeven met een grote steekproefgrootte (n), de steekproevenverdeling van het steekproefgemiddelde $\ov y$ een normale verdeling benadert. Zelfs in het geval dat de populatie niet normaal verdeeld is! (Boek: p. 93)

Vraag 5b

Bekijk nu de steekproevenverdelingen van het schatten van de mediaan. Beschrijf wat je ziet. Vind je de verdelingen normaal verdeeld?

Vraag 5c

Is er een geval waarbij de mediaan beter geschat wordt dan het gemiddelde? Kun je een geval bedenken waarin de mediaan sowieso een betere representatie van de populatie is dan het gemiddelde?

Vraag 5d

Vergelijk de spreiding van de steekproevenverdelingen van het gemiddelde en de mediaan. Wat zegt dit over de efficiëntie van de beide schatters?

Vraag 6

Leg het verschil uit tussen een steekproefverdeling en een steekproevenverdeling.

Dit is het einde van de opdrachten van Week 1.

Ga terug naar de vorige opdracht
Figuur 4. De rode lijn geeft het gemiddelde van de populatie aan (μ=50), en de blauwe lijn de mediaan. De rode gestippelde lijn is het gemiddelde van de steekproefgemiddelden, en de blauwe gestippelde lijn het gemiddelde van de steekproefmedianen. De steekproevenverdeling van de steekproefgemiddeldes kunnnen worden gevonden in het tabblad "Gemiddelde", en de steekproevenverdeling van steekproefmedianen in het tabblad "Mediaan".