Centrale limietstelling

In de kansrekening worden met centrale limietstelling stellingen aangeduid over de zwakke convergentie van sommen van onderling onafhankelijke stochastische variabelen. De naam duidt erop dat het stellingen zijn die een centrale plaats innemen in de kansrekening en is door György Pólya voor het eerst genoemd.[1]
De bekendste daarvan, aangeduid als de centrale limietstelling of stelling van Lindeberg-Levy, geeft aan dat de som van een groot aantal onderling onafhankelijke en gelijk verdeelde stochastische variabelen met een eindige variantie bij benadering een normale verdeling heeft. De variabelen zelf hoeven daarvoor geen normale verdeling te hebben.
Andere centrale limietstellingen zijn generalisaties hiervan. Bij sommige is de sterke voorwaarde van gelijke verdeling afgezwakt tot bijvoorbeeld de Lindeberg-conditie of de Ljapunov-conditie. Bij andere is ook de onafhankelijkheid losgelaten en is een zwakke afhankelijkheid toegestaan tussen de stochastische variabelen.
Wat voor een som geldt, is ook van toepassing op het gemiddelde. Als de som van een aantal variabelen normaal is verdeeld of bij benadering normaal, is uiteraard ook hun gemiddelde normaal verdeeld, of bij benadering.
In het algemeen wordt de centrale limietstelling gebruikt ter rechtvaardiging van het gebruik van de normale verdeling. Dit is terecht voor gemiddelden van voldoende grote aantallen.
Stelling
[bewerken | brontekst bewerken]Laat een rij onderling onafhankelijke en gelijkverdeelde stochastische variabelen zijn met eindige standaardafwijking , verwachting en alle gedefinieerd op hetzelfde domein. Dan geldt:
- ,
waarin de verdelingsfunctie van de normale verdeling is.
Dit betekent dat de verdeling van de gestandaardiseerde partiële sommen
- ,
met
- ,
nadert naar de normale verdeling.
Gelijkwaardig daarmee kan men ook zeggen dat het steekproefgemiddelde
bij benadering normaal verdeeld is met verwachting μ en standaardafwijking .
Het hier volgende bewijs van de stelling berust op het gebruik van karakteristieke functies. Het oorspronkelijke bewijs door Lindeberg, die nog geen kennis over karakteristieke functies had, was 21 pagina's lang.
Iedere karakteristieke functie van een verdeling met verwachting 0 en variantie 1, kan in de omgeving van 0 worden ontwikkeld als:
De karakteristieke functie van de gestandaardiseerde som:
is dan:
Daarvoor geldt:
- ,
Opmerking
[bewerken | brontekst bewerken]Als de 'en normaal verdeeld zijn, is er geen reden de stelling toe te passen. Elke partiële som en steekproefgemiddelde is dan precies normaal verdeeld.
Voorbeeld met normale benadering
[bewerken | brontekst bewerken]Een experiment wordt onafhankelijk van de vorige keren herhaald. De uitkomst kan steeds "succes" of "mislukking" zijn. De kans op succes is . De stochastische variabele neemt de waarde 1 aan als het -e experiment een succes was en anders de waarde 0. De rij stochastische variabelen voldoen aan de voorwaarden van de stelling, met en . De som:
is dus bij benadering normaal verdeeld, met verwachting en variantie .
De exacte verdeling van is de binomiale verdeling met parameters en
De centrale limietstelling laat dus zien hoe de binomiale verdeling door een normale verdeling kan worden benaderd. Dit voorbeeld is ook de inhoud van de stelling van De Moivre-Laplace waarvan het toenmalige bewijs niet op de centrale limietstelling is gebaseerd.
- ↑ G Pólya. Über den zentralen Grenzwertsatz der Wahrscheinlichkeitsrechnung und das Momentenproblem, 1920. De centrale limietstelling van de kansrekening en het momentenprobleem, in Mathematische Zeitschrift, 8, 3–4, blz 171–181