Schatten

Uit Wikipedia, de vrije encyclopedie
Ga naar: navigatie, zoeken

Een categorie van methoden die de statistiek hanteert om informatie te verkrijgen, wordt gevormd door de schattingsmethoden. Een onbekende parameter van een populatie (of verdeling) wordt geschat door een uit de steekproef berekende grootheid, de schatting. Het voorschrift dat bepaalt hoe de schatting uit de steekproef moet worden berekend, wordt schatter genoemd.

Algemeen bekend is het (steekproef-)gemiddelde als schatting voor het populatiegemiddelde (of de verwachtingswaarde).

Voorbeelden[bewerken]

Een vreemde munt ziet er niet bepaald symmetrisch uit, zodat de kans p op kop vermoedelijk niet \begin{matrix}\frac 12\end{matrix} zal zijn. Daarom gooien we 10 keer met de munt. Stel dat we in deze steekproef 3 keer kop vinden. We zouden dan de onbekende parameter p (de populatiefractie) kunnen schatten door de steekproeffractie \begin{matrix}\frac 3{10}\end{matrix} .

Een ander voorbeeld is bekend uit de Tweede Wereldoorlog. Het viel de Engelsen op dat de neergehaalde Duitse bommenwerpers "gründlich" voorzien waren van een serienummer. Op grond van de gevonden serienummers in de "steekproef" gaven statistici een schatting van het totale aantal geproduceerde vliegtuigen N van dat type. Het zal duidelijk zijn dat alleen het hoogste gevonden nummer M van belang is, d.w.z. een goede schatter zal alleen afhankelijk zijn van M . Men kan laten zien dat bij een steekproefomvang n, een goede schatting van N gegeven wordt door:

\hat N = \left(1+\frac 1n\right) M.

Schatter[bewerken]

Het schatten van een parameter van een populatie of kansverdeling gebeurt door middel van een schatter, dat is een steekproeffunctie: een functie die uit de steekproef een getal, de schatting, berekent. Hoewel iedere steekproeffunctie aangemerkt kan worden als schatter, is het zaak goede schatters te vinden. Een goede schatter zal schattingen vinden die in bepaalde zin niet veel afwijken van de onbekende waarde van de parameter. Een bijzondere groep van 'goede' schatters zijn de zuivere schatters. Zuivere schatter zijn schatters die gemiddeld, over alle mogelijke steekproeven, precies de waarde van de te schatten parameter opleveren. Preciezer gezegd: een schatter is zuiver wanneer de verwachtingswaarde van de schatter gelijk is aan de te schatten parameter. De 'uniform beste zuivere schatter' is daarbij de schatter die voor alle mogelijke parameterwaarden de kleinste variantie heeft van alle zuivere schatters.

Voorbeelden[bewerken]

Laat \scriptstyle X_1, \dots , X_n een aselecte steekproef zijn uit een populatie of kansverdeling.

Binomiale verdeling: B(n,p). De te schatten parameter is de succeskans (populatiefractie) p. Laat X het aantal successen in de steekproef zijn, dan kan p geschat worden door o.a. de schatters: X/n (de steekproeffractie), X/(n+1) en (X+1)/(n+2).

Uniforme verdeling op het interval [0,M]. De te schatten parameter is de bovengrens M. Geschikte schatters zijn: maxXi (de bovengrens in de steekproef) en \scriptstyle (1+\tfrac 1n)max Xi.

Willekeurige populatie (of verdeling) met populatiegemiddelde \mu en populatievariantie \sigma^2. Goede schatters zijn de overeenkomstige grootheden in de steekproef. Het steekproefgemiddelde als schatter voor \mu, en de steekproefvariantie voor \sigma^2.