Binomiale verdeling

Uit Wikipedia, de vrije encyclopedie
Ga naar: navigatie, zoeken
Binomiale verdeling
Kansfunctie
Verdelingsfunctie
Parameters aantal pogingen (geheel)
kans op succes (reëel)
Drager
Kansfunctie
Verdelingsfunctie
Verwachtingswaarde
Mediaan één uit
Modus
Variantie
Scheefheid
Kurtosis
Moment-
genererende functie
Karakteristieke functie
Portaal  Portaalicoon   Wiskunde

In de kansrekening en de statistiek is de binomiale verdeling een verdeling van het aantal successen X in een reeks van n onafhankelijke alternatieven alle met succeskans p. Zo'n experiment wordt ook wel een Bernoulli-experiment genoemd.

In het geval n = 1, komt de binomiale verdeling overeen met de Bernoulli-verdeling.

Definitie[bewerken]

In een reeks van n Bernoulli-experimenten kunnen 0, 1, ..., n successen voorkomen. Het aantal successen is een stochastische variabele X. De kans op precies k successen, P(X=k), kan gemakkelijk berekend worden als we bedenken dat elke reeks uitkomsten met k successen en n-k mislukkingen dezelfde kans pk(1-p)n-k heeft. Omdat er (zie binomiaalcoëfficiënt) verschillende reeksen zijn met precies k successen, wordt de kansfunctie voor k = 0, 1, ..., n gegeven door:

Voorbeeld[bewerken]

We gooien 4 keer met een (eerlijke) dobbelsteen. We kunnen 0, 1, 2, 3 of 4 keer een 6 gooien. Het aantal keren dat we 6 gooien, X, is Bin(4,1/6)-verdeeld. Hoe groot is de kans dat we van de 4 worpen 1 keer een 6 gooien? Hier is n = 4, p = 1/6 en k = 1, dus:

Momenten[bewerken]

De verwachtingswaarde en de variantie van een B(n,p)-verdeelde stochastische variabele X laten zich het eenvoudigst bepalen door X te schrijven als de som van n onafhankelijke, B(1,p)-verdeelde variabelen: . Dan volgt:

en

De bovenstaande relaties kunnen ook afgeleid worden met behulp van berekeningen soortgelijk aan de volgende:

Uit deze betrekking kan het derde moment bepaald worden, en daarmee de scheefheid van de verdeling.

Ook volgt daaruit direct:

en

Uit deze laatste relatie volgt weer:

zodat

Benadering[bewerken]

Het is nogal bewerkelijk of bijna ondoenlijk om voor grote waarden van het aantal experimenten n de exacte kansen te berekenen. Dit is ook niet nodig omdat de binomiale verdeling voor grote n benaderd kan worden door een normale verdeling of door een Poissonverdeling.

Als vuistregel neemt men wel dat de Bin(n,p)-verdeling voor n > 25 goed benaderd kan worden door een geschikte normale verdeling, mits de succeskans p niet te klein of te groot is. Als vuistregel geldt: np > 5 en n(1-p) > 5.Voor kleinere en grotere waarden van p is de binomiale verdeling te scheef om door de symmetrische normale verdeling goed benaderd te worden. Een benadering door een geschikte Poissonverdeling is dan mogelijk.

Normale benadering[bewerken]

De stochastische variabele X is Bin(n,p)-verdeeld. Voor toenemende n nadert de verdeling van X een normale verdeling, dus met verwachting E(X) = np en variantie var(X) = np(1-p). Er geldt dus:

.

Daarin is Y N(np,np(1-p))-verdeeld en Z standaardnormaal verdeeld.

Omdat de binomiale verdeling een discrete verdeling is, geldt

,

hetgeen leidt tot twee (en meer) mogelijke benaderingen, die voor niet al te grote waarden van n nog al verschillen. Om dit probleem te ondervangen past men wel de zogenaamde continuïteitscorrectie toe, en neemt als betere benadering een waarde tussen de genoemde uitersten, en wel:

.

Voorbeeld[bewerken]

Hoe groot is de kans om in 25 worpen met een zuivere munt ten hoogste 10 keer kruis te gooien? We noemen het aantal keren kruis X, dat dus Bin(25,)-verdeeld is. De gevraagde kans is:

.

Omdat E(X) = np = 12,5 en var(X) = np(1-p) = 6,25, kunnen we deze kans benaderend vinden met behulp van een N(12,5;6,25)-verdeling.

.

We kunnen ook berekenen:

.

We zien twee benaderingen die nogal uiteenlopen, maar waar de werkelijke waarde wel tussin ligt. Met de continuïteitscorrectie krijgen we:

.

Poissonbenadering[bewerken]

Omdat de Bin(n,p)-verdeling voor toenemende n en constante waarde van np = μ nadert naar de Poissonverdeling met parameter μ, kan de Bin(n,p)-verdeling voor grote waarden van n en waarden van p in de buurt van 0 benaderd worden door een geschikte Poissonverdeling. Er geldt dus voor X met een Bin(n,p)-verdeling met grote n en kleine waarde van p:

.

Daarin is Y Poissonverdeeld met parameter np.

Ook voor waarden van p in de buurt van 1 kan deze benadering gebruikt worden, zij het dat men niet de verdeling van X benadert, maar de verdeling van n-X, die Bin(n,1-p)-verdeeld is, dus met een kleine waarde van p.

Voorbeeld[bewerken]

Hoe groot is de kans om in 25 worpen met een zuivere dobbelsteen ten hoogste 2 keer 6 te gooien? We noemen X het aantal keren 6. X is dus Bin(25,1/6)-verdeeld. De gevraagde kans is:

.

Omdat EX = np = 25/6 kunnen we deze kans benaderend vinden met behulp van een Poissonverdeling met parameter 25/6.

.

Hoe groot is de kans om in 25 worpen met een zuivere dobbelsteen minstens 20 keer geen 6 te gooien? We noemen X het aantal keren dat we geen 6 gooien. X is dus Bin(25,5/6)-verdeeld. De gevraagde kans is:

.

Nu is p tamelijk groot, maar we kunnen de vraag ook formuleren als de kans op ten hoogste 5 keer 6.

.

En 25 - X is weer Bin(25,1/6)-verdeeld, dus:

.

Zie ook[bewerken]