Binomiale verdeling

Uit Wikipedia, de vrije encyclopedie
Ga naar: navigatie, zoeken
Binomiale verdeling
Kansfunctie
Verdelingsfunctie
Parameters n \geq 0 aantal pogingen (geheel)
0\leq p \leq 1 kans op succes (reëel)
Drager k \in \{0,\dots,n\}\!
Kansfunctie \tbinom nk p^k (1-p)^{n-k} \!
Verdelingsfunctie I_{1-p}(n-\lfloor k\rfloor, 1+\lfloor k\rfloor) \!
Verwachtingswaarde n\,p\!
Mediaan één uit \{\lfloor n\,p\rfloor-1, \lfloor n\,p\rfloor, \lfloor n\,p\rfloor+1\}
Modus \lfloor (n+1)\,p\rfloor\!
Variantie n\,p\,(1-p)\!
Scheefheid \frac{1-2\,p}{\sqrt{n\,p\,(1-p)}}\!
Kurtosis \frac{1-6\,p\,(1-p)}{n\,p\,(1-p)}\!
Moment-
genererende functie
(1-p + p\,e^t)^n \!
Karakteristieke functie (1-p + p\,e^{i\,t})^n \!
Portaal  Portaalicoon   Wiskunde

In de kansrekening en de statistiek is de binomiale verdeling een verdeling van het aantal successen X in een reeks van n onafhankelijke alternatieven alle met succeskans p. Zo'n experiment wordt ook wel een Bernoulli-experiment genoemd.

In het geval n = 1, komt de binomiale verdeling overeen met de Bernoulli-verdeling.

Definitie[bewerken]

In een reeks van n Bernoulli-experimenten kunnen 0, 1, ..., n successen voorkomen. Het aantal successen is een stochastische variabele X. De kans op precies k successen, P(X=k), kan gemakkelijk berekend worden als we bedenken dat elke reeks uitkomsten met k successen en n-k mislukkingen dezelfde kans pk(1-p)n-k heeft. Omdat er \tbinom nk (zie binomiaalcoëfficiënt) verschillende reeksen zijn met precies k successen, wordt de kansfunctie voor k = 0, 1, ..., n gegeven door:

f(k;n,p) = P(X=k)=\tbinom nk p^{k}(1-p)^{n-k}

Voorbeeld[bewerken]

We gooien 4 keer met een (eerlijke) dobbelsteen. We kunnen 0, 1, 2, 3 of 4 keer een 6 gooien. Het aantal keren dat we 6 gooien, X, is Bin(4,1/6)-verdeeld. Hoe groot is de kans dat we van de 4 worpen 1 keer een 6 gooien? Hier is n = 4, p = 1/6 en k = 1, dus:

P(X=1)=f(1;4,\tfrac16) = \tbinom 41 (\tfrac 16)^{1}(1-\tfrac 16)^{3} = 4\times \tfrac 16 \times \tfrac {125}{216} = 0{,}386

Momenten[bewerken]

De verwachtingswaarde en de variantie van een B(n,p)-verdeelde stochastische variabele X laten zich het eenvoudigst bepalen door X te schrijven als de som van n onafhankelijke, B(1,p)-verdeelde variabelen: X=X_1+\cdots +X_n. Dan volgt:

EX=E(X_1+\cdots +X_n)=nE(X_1)=np

en

\operatorname{var}(X)=\operatorname{var}(X_1+\cdots +X_n)=n\,\operatorname{var}(X_1)=np(1-p).

De bovenstaande relaties kunnen ook afgeleid worden met behulp van berekeningen soortgelijk aan de volgende:

EX(X-1)(X-2)=\sum_{k=0}^n k(k-1)(k-2)\frac{n!}{k!(n-k)!}p^k(1-p)^{n-k}
=n(n-1)(n-2)p^3\sum_{k=3}^n \frac{(n-3)!}{(k-3)!(n-k)!}p^{k-3}(1-p)^{n-k}=n(n-1)(n-2)p^3.

Uit deze betrekking kan het derde moment EX^3 bepaald worden, en daarmee de scheefheid van de verdeling.

Ook volgt daaruit direct:

EX=\sum_{k=0}^n k\frac{n!}{k!(n-k)!}p^k(1-p)^{n-k}=np

en

EX(X-1)=\sum_{k=0}^n k(k-1)\frac{n!}{k!(n-k)!}p^k(1-p)^{n-k}=n(n-1)p^2.

Uit deze laatste relatie volgt weer:

\!\,EX^2=n(n-1)p^2+np,

zodat

\operatorname{var}(X)=EX^2-(EX)^2=n(n-1)p^2+np-n^2p^2=np(1-p).

Benadering[bewerken]

Het is nogal bewerkelijk of bijna ondoenlijk om voor grote waarden van het aantal experimenten n de exacte kansen te berekenen. Dit is ook niet nodig omdat de binomiale verdeling voor grote n benaderd kan worden door een normale verdeling of door een Poissonverdeling.

Als vuistregel neemt men wel dat de Bin(n,p)-verdeling voor n > 25 goed benaderd kan worden door een geschikte normale verdeling, mits de succeskans p niet te klein of te groot is. Als vuistregel geldt: np > 5 en n(1-p) > 5.Voor kleinere en grotere waarden van p is de binomiale verdeling te scheef om door de symmetrische normale verdeling goed benaderd te worden. Een benadering door een geschikte Poissonverdeling is dan mogelijk.

Normale benadering[bewerken]

De stochastische variabele X is Bin(n,p)-verdeeld. Voor toenemende n nadert de verdeling van X een normale verdeling, dus met verwachting E(X) = np en variantie var(X) = np(1-p). Er geldt dus:

P(X \le k) \approx P(Y \le k) = P\left(Z \le \frac{k-np}{\sqrt{np(1-p)}}\right).

Daarin is Y N(np,np(1-p))-verdeeld en Z standaardnormaal verdeeld.

Omdat de binomiale verdeling een discrete verdeling is, geldt

P(X \le k)=P(X<k+1)\approx P(Y \le k+1) ,

hetgeen leidt tot twee (en meer) mogelijke benaderingen, die voor niet al te grote waarden van n nog al verschillen. Om dit probleem te ondervangen past men wel de zogenaamde continuïteitscorrectie toe, en neemt als betere benadering een waarde tussen de genoemde uitersten, en wel:

P(X \le k)=P(X<k+1)\approx P(Y \le k+\begin{matrix}\frac 12 \end{matrix})= P\left(Z \le \frac{k+\begin{matrix}\frac 12 \end{matrix}-np}{\sqrt{np(1-p)}}\right) .

Voorbeeld[bewerken]

Hoe groot is de kans om in 25 worpen met een zuivere munt ten hoogste 10 keer kruis te gooien? We noemen het aantal keren kruis X, dat dus Bin(25,\tfrac 12)-verdeeld is. De gevraagde kans is:

P(X \le 10)=0{,}2122.

Omdat E(X) = np = 12,5 en var(X) = np(1-p) = 6,25, kunnen we deze kans benaderend vinden met behulp van een N(12,5;6,25)-verdeling.

P(X \le 10)\approx P(Y \le 10)= P\left(Z \le \frac{10-12{,}5}{\sqrt{6{,}25}}\right)=P(Z<-1) = 0{,}1587.

We kunnen ook berekenen:

P(X < 11)\approx P(Y <11)= P\left(Z \le \frac{11-12{,}5}{\sqrt{6{,}25}}\right)=P(Z<-0{,}6) = 0{,}2743.

We zien twee benaderingen die nogal uiteenlopen, maar waar de werkelijke waarde wel tussin ligt. Met de continuïteitscorrectie krijgen we:

P(X \le 10)\approx P(Y \le 10{,}5)= P\left(Z \le \frac{10{,}5-12{,}5}{\sqrt{6{,}25}}\right)=P(Z<-0{,}8) = 0{,}2119.

Poissonbenadering[bewerken]

Omdat de Bin(n,p)-verdeling voor toenemende n en constante waarde van np = μ nadert naar de Poissonverdeling met parameter μ, kan de Bin(n,p)-verdeling voor grote waarden van n en waarden van p in de buurt van 0 benaderd worden door een geschikte Poissonverdeling. Er geldt dus voor X met een Bin(n,p)-verdeling met grote n en kleine waarde van p:

P(X \le k) \approx P(Y \le k).

Daarin is Y Poissonverdeeld met parameter np.

Ook voor waarden van p in de buurt van 1 kan deze benadering gebruikt worden, zij het dat men niet de verdeling van X benadert, maar de verdeling van n-X, die Bin(n,1-p)-verdeeld is, dus met een kleine waarde van p.

Voorbeeld[bewerken]

Hoe groot is de kans om in 25 worpen met een zuivere dobbelsteen ten hoogste 2 keer 6 te gooien? We noemen X het aantal keren 6. X is dus Bin(25,1/6)-verdeeld. De gevraagde kans is:

P(X \le 2)= 0,1887.

Omdat EX = np = 25/6 kunnen we deze kans benaderend vinden met behulp van een Poissonverdeling met parameter 25/6.

P(X \le 2)\approx P(Y \le 2)=0,2147.

Hoe groot is de kans om in 25 worpen met een zuivere dobbelsteen minstens 20 keer geen 6 te gooien? We noemen X het aantal keren dat we geen 6 gooien. X is dus Bin(25,5/6)-verdeeld. De gevraagde kans is:

P(X \ge 20)= 0,7720.

Nu is p tamelijk groot, maar we kunnen de vraag ook formuleren als de kans op ten hoogste 5 keer 6.

P(X \ge 20)= P(25-X \le 5).

En 25 - X is weer Bin(25,1/6)-verdeeld, dus:

P(X \ge 20)= P(25-X \le 5)\approx P(Y \le 5)=0,7586.

Zie ook[bewerken]