Eindigepopulatiecorrectiefactor

Uit Wikipedia, de vrije encyclopedie

Trekt men een steekproef uit een oneindige populatie, dan zal het praktisch gesproken geen verschil maken of de steekproef al dan niet met terugleggen wordt getrokken. Voor een eindige populatie ligt dat anders, vooral als de steekproefomvang niet klein is vergeleken met de populatiegrootte. De eindigepopulatiecorrectiefactor, of correctiefactor voor eindige populatie is een factor, afhankelijk van de populatiegrootte en de steekproefomvang , die op sommige grootheden wordt toegepast om het effect van de eindigheid van de populatie te compenseren. Deze correctiefactor is:

Dichotomie[bewerken | brontekst bewerken]

Als de steekproef aselect getrokken wordt uit een dichotome populatie, is het aantal successen bij trekken met terugleggen binomiaal verdeeld, en bij trekken zonder terugleggen hypergeometrisch verdeeld. De standaardafwijkingen van deze verdelingen zijn respectievelijk:

waarin de fractie successen in de populatie is. Duidelijk is te zien dat de standaardafwijking bij trekken zonder terugleggen gelijk is aan de standaardafwijking bij trekken met terugleggen vermenigvuldigd met de correctiefactor.

Aselecte steekproef[bewerken | brontekst bewerken]

Ook in het geval dat de steekproef aselect getrokken wordt uit een willekeurige eindige populatie treedt de correctiefactor op.

Stel de populatie is en een aselecte steekproef daaruit. Elk van de steekproefelementen is homogeen verdeeld, en heeft als variantie:

.

De variantie van het steekproefgemiddelde is bij trekken met terugleggen:

.

Bij trekken zonder terugleggen is:

,

De standaardafwijkingen zijn dus bij trekken met terugleggen:

,

en bij trekken zonder terugleggen

.

waarin weer de eindigepopulatiecorrectiefactor als factor voorkomt.

Voorbeeld[bewerken | brontekst bewerken]

Een populatie bestaat uit 400 flessen water met daarin opgelost een bepaald hoeveelheid (in mmol) radioactieve stof. Men wil een schatting maken van de totale hoeveelheid radioactieve stof. Omdat het te tijdrovend en te kostbaar is om alle 400 flessen te onderzoeken, heeft men een aselecte steekproef van 30 flessen genomen en heeft men de hoeveelheid stof in die flessen bepaald. De gemiddelde hoeveelheid stof per fles in de flessen van de steekproef blijkt 500 mmol te zijn met een standaardafwijking van 45 mmol.

Het benaderde 95%-betrouwbaarheidsinterval voor de gemiddelde hoeveelheid radioactieve stof per fles in de populatie van 400 flessen wordt gegeven door:

.

Daarin is het 97,5-percentiel van de t(29)-verdeling.

Proporties[bewerken | brontekst bewerken]

De eindigepopulatiecorrectiefactor speelt ook een rol bij het bepalen van een betrouwbaarheidsinterval voor de fractie successen in een eindige dichotome populatie van omvang . Als bij trekkingen zonder terugleggen het aantal successen is, dan is met een benaderend -betrouwbaarheidsinterval voor :

.

Daarin is , met de verdelingsfunctie van de standaardnormale verdeling.

Voorbeeld[bewerken | brontekst bewerken]

Een klant heeft 200 voorwerpen besteld bij een fabrikant. Om een idee te krijgen van de kwaliteit van de geleverde producten neemt de klant een steekproef van 20 stuks en onderzoekt of elk product al dan niet defect is. 30% van de voorwerpen in de steekproef blijkt defect te zijn. De klant berekent het benaderde 95%-betrouwbaarheidsinterval van de fractie defecten in de populatie:

Zonder eindigepopulatiecorrectie zou dit zijn. Dat illustreert het feit dat de eindigepopulatiecorrectie van een steekproef van 10% van de populatiegrootte in de buurt van 1 ligt en vaak verwaarloosd kan worden. Voor niet te kleine populatiegrootte en steekproefomvang 10% daarvan, is immers:

Naarmate de steekproefgrootte toeneemt bij gelijkblijvende populatiegrootte, neemt de eindigepopulatiecorrectiefactor steeds meer af. Dat ligt ook voor de hand: de afnemende breedte van het betrouwbaarheidsinterval, dat ook als onzekerheidsinterval kan worden opgevat, reflecteert de toenemende hoeveelheid informatie in de steekproef.