Steekproef

Uit Wikipedia, de vrije encyclopedie
Ga naar: navigatie, zoeken
Keurmeester op een kaasmarkt

Een steekproef of monster, een statistisch begrip, is een selectie uit een totale populatie ten behoeve van een meting van bepaalde eigenschappen van die populatie. In het dagelijkse spraakgebruik kan een monster ook een voorbeeld van één individu uit een populatie betekenen.

De term steekproef is afkomstig van de kaasmarkt, waar de keurmeester een kaasboor (een speciaal soort mes) in de kaas stak om uit het midden van de kaas een stukje te keuren (proeven).

De keuze voor een meting met behulp van een steekproef in plaats van de totale populatie wordt bepaald door de volgende overwegingen:

  • bij een populatie van grote omvang is het praktisch ondoenlijk alle elementen te meten
  • als de metingen kostbaar zijn kan men slechts een beperkt aantal metingen doen
  • bij destructief onderzoek zou de hele populatie verloren gaan
  • als snelheid gewenst is, kan niet de hele populatie onderzocht worden
  • als er geen al te grote nauwkeurigheid verlangd is, kan met een steekproef worden volstaan
  • het is gemakkelijker slechts een deel van de populatie te onderzoeken.

Soorten steekproef[bewerken]

Men kan op verschillende manieren een steekproef verkrijgen.

Aselecte steekproef[bewerken]

Als alle elementen uit de populatie dezelfde kans hebben om in de steekproef te worden opgenomen, spreekt men van een aselecte steekproef.

Selecte steekproef[bewerken]

Men spreekt van een selecte steekproef wanneer de elementen niet op toevalsbasis uit een populatie worden genomen.

Representatieve steekproef[bewerken]

Als de populatie ten aanzien van een bepaald kenmerk is gepartitioneerd in een aantal klassen (categorieën, lagen), zorgt men in een representatieve steekproef ervoor dat deze klassen in dezelfde verhouding in de steekproef vertegenwoordigd zijn als in de populatie. Zorgt men er bijvoorbeeld voor dat de verhouding waarin mannen en vrouwen in de steekproef voorkomen ongeveer gelijk is aan de verhouding in de bevolking, dan heet de steekproef representatief (althans wat het kenmerk geslacht betreft). De keuze bepaalt in grote mate de validiteit van verdere analyse.

Quotasteekproef[bewerken]

Een quotasteekproef is een vorm van representatieve steekproef. De aantallen voor de te representeren categorieën, de quota, worden vooraf bepaald, maar het wordt aan degenen die daadwerkelijk de steekproef uitvoeren, overgelaten de elementen zelf te kiezen, als de gewenste quota maar gehaald worden.

Gelaagde of gestratificeerde steekproef[bewerken]

Als de populatie ten aanzien van een bepaald kenmerk is verdeeld in een aantal klassen (categorieën, lagen), spreekt men van een gelaagde of gestratificeerde steekproef, als de steekproef gevormd wordt door steekproeven uit elk der klassen. Een voorbeeld hiervan is een steekproef waarbij uit elke klas (de categorieën) van een basisschool 3 leerlingen worden gekozen.

Clustersteekproef[bewerken]

Als de populatie is verdeeld in een aantal vergelijkbare deelpopulaties worden deze deelpopulaties 'clusters' genoemd. Men spreekt van een clustersteekproef, wanneer er een aselecte steekproef uit de clusters wordt getrokken en men vervolgens alle elementen van de geselecteerde clusters in de steekproef opneemt. Een voorbeeld van een clustersteekproef is het onderzoeken van de teamleden van 3 van de 20 sportteams van een sportclub. Hierbij zijn dus alle elementen (nl. de sporters) van de 3 deelpopulaties (sportteams) uit de gehele populatie (de sportclub) gekozen.

Systematische steekproef[bewerken]

In een systematische steekproef worden de elementen die in de steekproef worden opgenomen, op systematische wijze bepaald. Zo kan als systeem gehanteerd worden dat elke tiende voorbijganger ondervraagd wordt, tot het gewenste aantal bereikt is.

Gemakssteekproef[bewerken]

In een gemakssteekproef worden de elementen die in de steekproef worden opgenomen, gekozen uit een voor de hand liggend, gemakkelijk toegankelijk deel van de populatie.

Sneeuwbalsteekproef[bewerken]

In gevallen waarin de elementen van de populatie moeilijk bereikbaar zijn, wordt wel een volgend element in de steekproef aangewezen of bepaald door een vorig element, waardoor een soort sneeuwbaleffect ontstaat. Een op deze wijze verkregen steekproef wordt sneeuwbalsteekproef genoemd.

Voorbeelden[bewerken]

Een fraai voorbeeld van een steekproef in materiële en statistische zin is (was) te zien tijdens de suikerbietencampagne in Noord-Holland. De bieten worden, nadat ze gerooid zijn, met vrachtwagens naar een schip gebracht om verder naar de fabriek vervoerd te worden. Omdat de vrachtwagens bieten van verschillende bedrijven aanvoeren, wordt elke vrachtwagen zowel voor als na het lossen gewogen, maar tevens wordt met een groot apparaat van elke vrachtwagen letterlijk een steekproef genomen op een willekeurige plaats in de lading om de kwaliteit vast te stellen.

Bij een ander voorbeeld kan men van 1000 geldbeugels (steekproef) tellen hoeveel buitenlandse euromuntjes erin zitten. Op grond daarvan kan men dan schatten hoeveel vreemde euromuntjes er in het hele land (populatie) in omloop zijn. Een schatting heeft altijd een foutenmarge, die afhangt van de wijze van trekken van de steekproef. Neemt men relatief veel geldbeugels uit grensgemeenten in de steekproef op, dan is deze niet representatief, met als gevolg een vertekende uitkomst.

Variabiliteit bij steekproeven[bewerken]

Doordat iedere steekproef uit andere elementen van de populatie kan bestaan, verschillen de uitkomsten gewoonlijk van elkaar, men noemt dit /spreekt dan van: variabiliteit bij steekproeven.

Schatters[bewerken]

De manier van verwerking van de resultaten van een steekproef heet een schatter. De keuze voor een schatter hangt af van de te verwachten eigenaardigheden van de kansverdeling in een populatie en van de eigenschap van de populatie waarin men geïnteresseerd is. De meest gangbare schatters zijn:

  • het rekenkundig gemiddelde (de som van de waargenomen waarden gedeeld door het aantal waarnemingen)
  • de mediaan (de middelste waarde uit de op waarde gesorteerde reeks waarnemingen)
  • de modale waarde (de waarde met de meeste voorkomens in een reeks waarnemingen)

Daarnaast zijn er schatters voor de spreiding en voor de scheefheid van de steekproef.

Vertekening[bewerken]

Wanneer men systematisch bepaalde uitkomsten, gewild of ongewild, bevoordeelt, dan spreekt men van een vertekening. Zo hield men bv. in de tijd dat nog lang niet iedereen een telefoon had een telefonische enquête, waardoor natuurlijk sterke vertekening optrad.