Hypergeometrische verdeling

Uit Wikipedia, de vrije encyclopedie
Ga naar: navigatie, zoeken

De hypergeometrische kansverdeling is in de kansrekening een discrete verdeling. Het is het analogon van de binomiale verdeling wanneer er sprake is van een steekproef uit een eindige populatie zonder terugleggen. De kansen op succes en mislukking veranderen dus per trekking en zijn afhankelijk van vorige uitkomsten.

Definitie[bewerken]

Doet men n aselecte trekkingen zonder terugleggen uit een populatie ter grootte N, waarin M successen (en dus N - M mislukkingen) zijn, dan wordt de kans op m successen voor m = 0, 1, ..., n gegeven door:

p(m)=\frac{{M \choose m}{N-M \choose n-m}}{{N \choose n}}.

Als de stochastische variabele X het aantal successen bij de n trekkingen voorstelt, geldt:

P(X=m|N,M,n) = p(m)\,

en zegt men dat X hypergeometrisch verdeeld is met parameters N,M en n.

Verwachtingswaarde en variantie[bewerken]

De verwachtingswaarde van een hypergeometrisch verdeelde stochastische variable X is:

{\rm E}(X)=n\frac{M}{N}.

De variantie is:

{\rm var}(X)=n \frac{M}{N} \left( 1-\frac{M}{N} \right) \frac{N-n}{N-1}\ .

De variantie verschilt een factor

\frac{N-n}{N-1}

van de variantie in het geval van trekken met terugleggen of bij trekken uit een oneindige populatie met succeskans p=M/N. De wortel uit deze factor

\sqrt{\frac{N-n}{N-1}}

heet eindige populatie-correctiefactor of correctiefactor voor eindige populatie.

Voorbeeld[bewerken]

Stel in een bak bevinden zich 5 blauwe en 4 rode ballen. Je pakt willekeurig 3 ballen uit de bak. Hoe groot is de kans dat je (precies) twee blauwe ballen hebt gepakt?.

In dit geval is N = 9, M = 5 en n = 3. De kans op m = 2 blauwe ballen is dus:

P(X=2 |9,5,3) = \frac{{5 \choose 2}{4 \choose 1}}{{9 \choose 3}} = \frac{10 \cdot 4}{84} = 0{,}476

Op eenzelfde manier kan je de kansen bepalen op 0 blauwe ballen (4.8%); 1 blauwe bal (35.7%) en 3 blauwe ballen (11.9%).

Externe link[bewerken]