Bernoullisteekproef

Uit Wikipedia, de vrije encyclopedie
Ga naar: navigatie, zoeken

In de statistiek is een Bernoullisteekproef (genoemd naar de Zwitser Jakob Bernoulli) van een zekere eindige populatie een steekproef waarbij elk element van de populatie eenzelfde kans q, tussen 0 en 1, heeft om in de steekproef opgenomen te worden. Met andere woorden: een Bernoullisteekproef wordt gevormd door voor elk element in de populatie een onafhankelijk Bernoulli-experiment uit te voeren met kans op "succes" gelijk aan q.

De Bernoullisteekproef is een bijzonder geval van de Poissonsteekproef. In de Poissonsteekproef wordt voor elk element in de populatie ook een onafhankelijk Bernoulli-experiment uitgevoerd, maar daar kan de kans op succes verschillen van element tot element.

Eigenschappen[bewerken]

Bernoullisteekproeven zijn uniform; dat wil zeggen dat alle Bernoullisteekproeven van gelijke grootte even waarschijnlijk zijn.

De grootte van een Bernoullisteekproef staat niet a priori vast. Voor een gegeven populatie met grootte N vormen de grootten van afzonderlijke Bernoullisteekproeven met dezelfde waarschijnlijkheid q een binomiale verdeling met gemiddelde Nq en variantie Nq(1-q). Als bijvoorbeeld q=0,1 heeft elk element van de populatie een waarschijnlijkheid van 0,1 om in de steekproef opgenomen te worden en is de gemiddelde grootte van de steekproef één tiende van de grootte van de populatie. De werkelijke grootte van een Bernoullisteekproef kan in principe variëren van 0 tot de populatiegrootte N.

Als S1 een Bernoullisteekproef met kans q is uit een populatie P1 en S2 een Bernoullisteekproef uit een populatie P2 met dezelfde kans q, en de twee populaties P1 en P2 zijn disjuncte verzamelingen, dan is de vereniging S_1 \cup S_2 een Bernoullisteekproef (met kans q) van de vereniging van de twee populaties P_1 \cup P_2. Dit volgt uit het feit dat items onafhankelijk van elkaar in de steekproef worden opgenomen.

Als S een Bernoullisteekproef met kans q is uit een populatie P, en S' een Bernoullisteekproef met kans p uit steekproef S, dan is S' een Bernoullisteekproef met kans pq uit de oorspronkelijke populatie P.

Voorbeeld[bewerken]

Men kan een Bernoullisteekproef bijvoorbeeld in databases gebruiken om uit een zeer grote tabel een testtabel te construeren. Als er daarna items (rijen) aan de grote tabel worden toegevoegd of eruit verwijderd, kan men de Bernoullisteekproef mee aanpassen zonder die opnieuw te moeten opbouwen. Wanneer er een nieuw item aan de grote tabel wordt toegevoegd, wordt dit met kans q aan de steekproef toegevoegd (waarin q dezelfde kans is waarmee de steekproef werd opgebouwd). Wanneer er een item uit de tabel wordt verwijderd, wordt dit ook uit de steekproef verwijderd als het daarin voorkomt (dit veronderstelt steeds dat er in de tabel geen duplicaten voorkomen).