Geometrische verdeling

Uit Wikipedia, de vrije encyclopedie
Ga naar: navigatie, zoeken

In de kansrekening en de statistiek is de geometrische verdeling een discrete kansverdeling.

Als we een reeks onafhankelijke Bernoulli-pogingen doen met succeskans p, kunnen we een vast aantal beschouwen, zodat we maar moeten afwachten hoe vaak we succes zullen hebben. Dit leidt tot de binomiale verdeling. Gaan we echter net zolang door tot we succes hebben, dan moeten we maar afwachten hoe veel experimenten we moeten doen. Dat aantal, N, is nu een stochastische variabele met als verdeling de geometrische verdeling, gegeven door:

P(N=n)=(1-p)^{n-1}p \,, voor n=1,2,3, ...

Eenvoudig is in te zien dat deze kans ontstaat doordat er n-1 mislukkingen, elk met kans (1-p), voorafgaan aan het succes.

Alternatief definieert men de geometrisch verdeling ook als het aantal mislukkingen Y = N - 1 die optreden alvorens men een eerste succes heeft. Dit aantal komt uit de verzameling { 0, 1, 2, 3, ...}. De kans dat er dan n mislukkingen optreden voor het eerste succes is dan gegeven door:

P(Y=n) = (1 - p)^n p\,, voor n = 0, 1, 2, 3, ....

Welke van deze twee definities men "de" geometrische verdeling noemt hangt af van conventie en gemak.

Beschouw bijvoorbeeld een gewone dobbelsteen die herhaaldelijk geworpen wordt tot een eerste keer "1" verschijnt. De kansverdeling van het aantal keren de dobbelsteen gegooid wordt, wordt gedragen door de eindige verzameling { 1, 2, 3, ... } en is geometrisch verdeeld met p = 1/6.

De verwachtingswaarde E(N) van een geometrische verdeelde toevalsgrootheid N en de variantie var(N) zijn:

\ E(N) = \frac{1}{p} \quad ; \quad \mbox{var}(N) = \frac{1-p}{p^2}.

Voor de geometrisch verdeelde toevalsgrootheid Y zijn deze grootheden:

\ E(Y) = \frac{1-p}{p} \quad ; \quad \mbox{var}(Y) = \frac{1-p}{p^2}.

De kansgenererende functies van N en Y zijn, respectievelijk,

G_N(s) = \frac{sp}{1-s(1-p)} \quad ; \quad G_Y(s) = \frac{p}{1-s(1-p)}, \quad |s| < (1-p)^{-1}.

Net zoals zijn continue analogon, de exponentiële verdeling, is de geometrische verdeling geheugenloos. Dat betekent dat wanneer je van plan bent een experiment te herhalen tot een eerste succes, wanneer het eerste succes nog niet voorgekomen is, de voorwaardelijke kansverdeling van het aantal additionele experimenten die nodig zijn, niet afhankelijk is van het aantal mislukkingen die al voorgevallen zijn. De dobbelsteen die men gooit of het muntstuk dat men opgooit, heeft geen "herinnering" aan deze mislukkingen. De geometrische verdeling is trouwens de enige geheugenloze discrete verdeling.

Van alle discrete kansfuncties die gedragen worden door {1, 2, 3, ... } met een gegeven verwachtingswaarde μ, heeft de geometrische verdeling met parameter p = 1/μ de grootste entropie.

De geometrische verdeling van het aantal mislukkingen Y voor het eerste succes is oneindig deelbaar, dat wil zeggen voor elk positief geheel getal n, bestaan er onafhankelijke, identiek verdeelde toevalsvariabelen Y1, ..., Yn waarvan de som dezelfde verdeling heeft als Y. Deze zijn overigens niet geometrisch verdeeld tenzij n = 1.

Verwante verdelingen[bewerken]

De geometrische verdeling is een speciaal geval van de negatief-binomiale verdeling, met r = 1. Meer algemeen, als Y1, ...,Yr onafhankelijke geometrisch verdeelde grootheden zijn met parameter p, dan volgt Z = \sum_{m=1}^r Y_m een negatief-binomiale verdeling met parameters r en p.

Als Y1, ...,Yr onafhankelijke geometrisch verdeelde grootheden zijn (met eventueel verschillende succesparameter pm), dan is hun minimum W = \min_{m} Y_m eveneens geometrisch verdeeld, met parameter p gegeven door:

\,p=1-\prod_{m}(1-p_m).

Externe links[bewerken]