Empirische verdelingsfunctie

Uit Wikipedia, de vrije encyclopedie
Ga naar: navigatie, zoeken

In de statistiek is de empirische verdelingsfunctie de (stochastische) verdelingsfunctie die zo goed mogelijk bij de gevonden data past. Het is een trapfunctie die telkens een sprong ter grootte 1/n maakt in elk van de n waarnemingen. De empirische verdelingsfunctie kan gezien worden als een schatter van de (cumulatieve) verdelingsfunctie die de verdeling beschrijft waaruit de data afkomstig zijn.

Definitie[bewerken]

De empirische verdelingsfunctie Fn van een aselecte steekproef X1, ...,Xn van X is gedefinieerd als:

F_n(x)=\frac 1n\,\mathrm{aantal} \{i|X_i\leq x\}.

De empirische verdelingsfunctie telt het relatieve aantal waarden Xi in de steekproef die kleiner of gelijk zijn aan x.

Een meer formele formulering van de definitie is:

F_n(x)=\frac 1n \sum_{i=1}^n I(X_i \le x),

waarin gebruikgemaakt is van de indicatorfunctie \!I die de waarde 1 of 0 aanneemt al naar gelang het i-de steekproefelement Xi kleiner of gelijk is aan x

Uit de definitie blijkt dat de empirische verdelingsfunctie een steekproeffunctie is, en dus een stochastische variabele.

De empirische verdelingsfunctie geeft de cumulatieve relatieve frequentie (CRF) weer. Een variant van de empirische verdelingsfunctie geeft de cumulatieve absolute frequenties (CAF) weer. De grafische voorstelling van de CRF noemt men het ogief, vanwege zijn vormovereenkomst met de architectonische ogief- of ojiefboog.

Cumulatieve frequentieverdeling van de doorlatendheid van de bodem gemeten met de boorgatmethode

Toepassing[bewerken]

Hoofdartikel: Cumulatieve frequentieanalyse

De empirische verdelingsfunctie kan gebruikt worden om na te gaan of de data uit een specifieke kansverdeling afkomstig zijn. Om bijvoorbeeld na te gaan of de onderliggende verdeling een normale verdeling is, kunnen de somfrequenties uitgezet worden op normaal waarschijnlijkheidspapier. Ontstaat een min of meer rechte lijn, dan mag worden aangenomen dat er van een normale verdeling sprake is.

De figuur is gemaakt met het CumFreq [1] computerprogramma, dat meerdere kansverdelingen naast de normale verdeling gebruikt.

Zie ook[bewerken]

Referenties[bewerken]

  1. CumFreq: een programma voor cumulatieve frequentieverdelingen. On line: [1] , van waar het programma vrij gedownload kan worden