Centrale limietstelling

Uit Wikipedia, de vrije encyclopedie
Ga naar: navigatie, zoeken

Met centrale limietstelling worden in de kansrekening stellingen aangeduid over de zwakke convergentie van sommen van onderling onafhankelijke stochastische variabelen.

Histogram met de gemiddeld aantal malen dat er een "kruis" wordt gegooid bij het tossen

De bekendste daarvan, aangeduid als de centrale limietstelling of stelling van Lindeberg-Levy, geeft aan dat de som van een groot aantal onderling onafhankelijke en gelijk verdeelde stochastische variabelen met eindige variantie bij benadering een normale verdeling heeft. De variabelen zelf behoeven daarvoor geen normale verdeling te hebben.

Andere centrale limietstellingen zijn generalisaties hiervan. Bij sommige is de sterke voorwaarde van gelijke verdeling afgezwakt tot bijvoorbeeld de Lindeberg-conditie of de Ljapunov-conditie. Bij andere is ook de onafhankelijkheid losgelaten en is een zwakke afhankelijkheid toegestaan tussen de stochastische variabelen.

Wat voor een som geldt, is ook van toepassing op het gemiddelde. Als de som van een aantal variabelen (bij benadering) normaal verdeeld is, is uiteraard ook hun gemiddelde (bij benadering) normaal verdeeld.

In het algemeen wordt de centrale limietstelling gebruikt ter rechtvaardiging van het gebruik van de normale verdeling. Dit is terecht voor gemiddelden van voldoende grote aantallen.

De centrale limietstelling[bewerken]

Laat X1, X2, X3, ... een rij onderling onafhankelijke en gelijkverdeelde stochastische variabelen zijn met eindige standaardafwijking σ, verwachting μ en alle gedefinieerd op hetzelfde domein. Dan geldt:

\lim_{n \to \infty} P\left(\frac{\sum_{k=1}^nX_k-n\mu}{\sigma\sqrt{n}} \le z\right) = \Phi(z),

waarin Φ de verdelingsfunctie van de standaardnormale verdeling is.


Dit betekent dat de verdeling van de de gestandaardiseerde partiële sommen

\frac{S_n-n\mu}{\sigma\sqrt{n}},

met

S_n=\sum_{k=1}^nX_k,

nadert naar de standaardnormale verdeling.

Gelijkwaardig daarmee kan men ook zeggen dat het steekproefgemiddelde

\overline{X}_n=\frac 1n S_n

bij benadering normaal verdeeld is met verwachting μ en standaardafwijking \sigma/\sqrt{n}.

Bewijs[bewerken]

Het hier volgende bewijs van de stelling berust op het gebruik van karakteristieke functies. Het oorspronkelijke bewijs door Lindeberg, die nog niet over karakteristieke functies beschikte, was 21 pagina's lang.

Iedere karakteristieke functie φ van een verdeling met verwachting 0 en variantie 1, kan in de omgeving van 0 ontwikkeld worden als:

\varphi(t) = 1 - \begin{matrix}\frac 12\end{matrix}t^2 + o(t^2).

De karakteristieke functie φn van de gestandaardiseerde som:

\frac{\sum_{k=1}^nX_k-n\mu}{\sigma\sqrt{n}}

is dan:

\varphi_n(t)=\left[\varphi\left({t \over \sqrt{n}}\right)\right]^n = \left[ 1 - {t^2
\over 2n} + o\left({t^2 \over n}\right) \right]^n.

Daarvoor geldt:

\lim_{n \to \infty}\varphi_n(t)= e^{-\frac 12 t^2},

wat juist de karakteristieke functie van de standaardnormale verdeling is. Maar dan convergeert ook de verdeling van de gestandaardiseerde sommen naar de N(0,1)-verdeling.

Opmerking[bewerken]

Als de X'en normaal verdeeld zijn, is er geen reden de stelling toe te passen. Elke partiële som en steekproefgemiddelde is dan exact normaal verdeeld.

Voorbeeld (normale benadering)[bewerken]

Een experiment wordt onafhankelijk van de vorige keren herhaald. De uitkomst kan steeds "succes" of "mislukking" zijn. De kans op succes is p. De stochastische variabele Xk neemt de waarde 1 aan als het k-e experiment een succes was en anders de waarde 0. De rij stochastische variabelen voldoen aan de voorwaarden van de stelling, met μ = p en σ = p(1-p). De som:

S_n=\sum_{k=1}^nX_k

is dus bij benadering normaal verdeeld, met verwachting np en variantie np(1-p).

De exacte verdeling van Sn is de binomiale verdeling met parameters n en p.

De centrale limietstelling laat dus zien hoe de binomiale verdeling benaderd kan worden door een normale verdeling. Dit voorbeeld is ook de inhoud van de stelling van De Moivre-Laplace waarvan het toenmalige bewijs niet stoelt op de centrale limietstelling.