Dergelijke regels bestaan wel, lijkt me, maar zijn niet al te simpel (er bestaan hele theoriën over welke verdeling er zou kunnen bij een set gemeten data). Er bestaan ook regels voor het overgaan tussen distributies/verdelingen: uit de centrale limietstelling volgt immers dat voor veel metingen een binomiaalverdeling en poissonverdeling evolueren naar een normaalverdeling als je parameters groot genoeg zijn.
Maar de makkelijkste en beste tip: plot je histogram dat je krijgt en vergelijk het met een histogram van de verdeling die je zou willen terugvinden. Een iets betere methode is natuurlijk je afvragen van waar de gegevens komen en door te weten wat de verschillende verdelingen eigenlijk voorstellen. Zo kan je voordat je gegevens bekijkt ook al een vvermoeden hebben hoe alles verdeeld zal zijn. Een binomiaalverdeling met kans p en aantal herhalingen n; beschrijft de uitkomst van het herhalen van n bernouilli-experimenten (waar je een kans p op succes hebt, en een kans 1-pp op falen), en waar elk experiment onafhankelijk is van elkaar. Een voorbeeld: bv. twee dobbelstelen opgooien en je wilt allebei een 4 gooien, je kans daarop is 1/6 (voor 1 dobbelsteen),en je hebt 2 herhalingen.
Voor een poissonverdeling is de intuitieve verklaring een fenomeen dat maar sporadisch gebeurt, dus bv. meteorietinslagen, ... De parameters hangen echter af van boek tot boek, dus ik ga je hier niet te veel uitleg over geven.
Een normaalverdeling is eigenlijk je meest klassieke verdeling: als je van een populatie een gewone grootheid gaat opmeten, kom je meestal uit op een normaalverdeling: lengte van personen, ...Deze is echter ook vrij moeilijk om te beschrijven als makkelijke wiskunde. Voor mezelf vind ik het het makkelijkste om dat te zien als een verdeling waarbij je al aanvoelt: alle elementen van mijjn populatie gaan ongeveer X als waarde hebben (gemiddelde), sommigen wat meer, anderen wat minder. Die 'wat meer/minder' is natuurlijk geheel relatief. Maar het geeft al meer de symmetrie aan van een normaalverdeling. Bij andere verdelingen ontbreekt die symmetrie vaak, maar komt die terug bij hoge parameterwaarden (en convergeert dat weer naar een normaalverdeling, zoals ik al zei).
__________________
vaknar staden långsamt och jag är full igen (Kent - Columbus)
|