Dat heeft te maken met het aantal vrijheidsgraden dat je overhoudt in je gegevens. Omdat je slechts een schatter gebruikt voor je gemiddelde, verlies je daar een vrijheidsgraad en dat is die 'N- 1'. Je kan dat als volgt een beetje zien: als je van je gegevens N getallen hebt, weet je genoeg om alles te weten. Als je echter van je getallen de schatter van je gemiddelde weet en N-1 getallen, weet je ook nog alles van je gegevens. Dus op je gegevens heb je door het gemiddelde te nemen, hebben maar N-1 van je getallen een onafhankelijkheid tegenover elkaar.
In principe is het dan ook verkeerd die formule met µ te noteren, want µ impliceert (toch in de cursussen die ik gevolgd heb), dat je het exacte gemiddelde hebt. De schatter wordt meestal m genoteerd. In dat geval mag je dus WEL delen door N. Dit is bv. het geval als je geen steekproef doet, maar een gehele populatie ondervraagt (je gemeten gemiddelde zal dan ook het gemiddelde van de populatie zijn, en dus geen schatter meer; en dus verlies je geen vrijheidsgraad). Maar in de praktijk ga je zo'n dingen amper doen.
Dat is gevoelsmatig waar die N-1 vandaan komt, de bijhorende wiskundige uitleg, weet ik spijtiggenoeg niet vanbuiten. Maar indien nodig, kan die wel opgezocht worden (met wat geluk staat dat ook op WikiPedia uitgelegd).
__________________
vaknar staden långsamt och jag är full igen (Kent - Columbus)
|