Schatten: verschil tussen versies

Uit Wikipedia, de vrije encyclopedie
Verwijderde inhoud Toegevoegde inhoud
Tekst iets gewijzigd. Graag niet oorspronkelijke tekst terugzetten Madyno, want die bevat echt fouten
Madyno (overleg | bijdragen)
→‎Voorbeelden: daar gaat het om
Regel 6: Regel 6:
Een vreemde [[munt (betaalmiddel)|munt]] ziet er niet bepaald symmetrisch uit, zodat de [[kansrekening|kans]] p op kop vermoedelijk niet <math>\begin{matrix}\frac 12\end{matrix}</math> zal zijn. Daarom gooien we 10 keer met de munt. Stel dat we in deze steekproef 3 keer kop vinden. We zouden dan de onbekende parameter p (de [[populatiefractie]]) kunnen schatten door de [[steekproeffractie]] <math>\begin{matrix}\frac 3{10}\end{matrix}</math> .
Een vreemde [[munt (betaalmiddel)|munt]] ziet er niet bepaald symmetrisch uit, zodat de [[kansrekening|kans]] p op kop vermoedelijk niet <math>\begin{matrix}\frac 12\end{matrix}</math> zal zijn. Daarom gooien we 10 keer met de munt. Stel dat we in deze steekproef 3 keer kop vinden. We zouden dan de onbekende parameter p (de [[populatiefractie]]) kunnen schatten door de [[steekproeffractie]] <math>\begin{matrix}\frac 3{10}\end{matrix}</math> .


Een ander voorbeeld is bekend uit de Tweede Wereldoorlog. Het viel de Engelsen op dat de neergehaalde Duitse bommenwerpers "gründlich" voorzien waren van een serienummer. Op grond van de gevonden serienummers in de "steekproef" gaven statistici een schatting van het totale aantal geproduceerde vliegtuigen ''N'' van dat type. Het zal duidelijk zijn dat het hoogste werkelijke serienummer ten minste het hoogste gevonden nummer serienummer ''M'' moet zijn. Men kan laten zien dat bij een steekproefomvang ''n'', een goede schatting van ''N'' gegeven wordt door:
Een ander voorbeeld is bekend uit de Tweede Wereldoorlog. Het viel de Engelsen op dat de neergehaalde Duitse bommenwerpers "gründlich" voorzien waren van een serienummer. Op grond van de gevonden serienummers in de "steekproef" gaven statistici een schatting van het totale aantal geproduceerde vliegtuigen ''N'' van dat type. Het zal duidelijk zijn dat alleen het hoogste gevonden nummer ''M'' van belang is, d.w.z. een goede schatter zal alleen afhankelijk zijn van ''M'' . Men kan laten zien dat bij een steekproefomvang ''n'', een goede schatting van ''N'' gegeven wordt door:


:<math>\hat N = \left(1+\frac 1n\right) M.</math>
:<math>\hat N = \left(1+\frac 1n\right) M.</math>

Versie van 21 mrt 2012 11:52

Een categorie van methoden die de statistiek hanteert om informatie te verkrijgen, wordt gevormd door de schattingsmethoden. Een onbekende parameter van een populatie (of verdeling) wordt geschat door een uit de steekproef berekende grootheid, de schatting. Het voorschrift dat bepaalt hoe de schatting uit de steekproef moet worden berekend, wordt schatter genoemd.

Algemeen bekend is het (steekproef-)gemiddelde als schatting voor het populatiegemiddelde (of de verwachtingswaarde).

Voorbeelden

Een vreemde munt ziet er niet bepaald symmetrisch uit, zodat de kans p op kop vermoedelijk niet zal zijn. Daarom gooien we 10 keer met de munt. Stel dat we in deze steekproef 3 keer kop vinden. We zouden dan de onbekende parameter p (de populatiefractie) kunnen schatten door de steekproeffractie .

Een ander voorbeeld is bekend uit de Tweede Wereldoorlog. Het viel de Engelsen op dat de neergehaalde Duitse bommenwerpers "gründlich" voorzien waren van een serienummer. Op grond van de gevonden serienummers in de "steekproef" gaven statistici een schatting van het totale aantal geproduceerde vliegtuigen N van dat type. Het zal duidelijk zijn dat alleen het hoogste gevonden nummer M van belang is, d.w.z. een goede schatter zal alleen afhankelijk zijn van M . Men kan laten zien dat bij een steekproefomvang n, een goede schatting van N gegeven wordt door:

Schatter

Het schatten van een parameter van en populatie of kansverdeling gebeurt door middel van een schatter, dat is een steekproeffunctie, dus een functie die uit de steekproef een getal, de schatting, berekend. Hoewel iedere steekproeffunctie aangemerkt kan worden als schatter, is het zaak goede schatters te vinden. Een goede schatter zal schattingen vinden die in bepaalde zin niet veel afwijken van de onbekende waarde van de parameter. Een bijzondere groep van 'goede' schatters zijn zuivere schatters. Een schatter is zuiver wanneer, ongeacht de werkelijke waarde van de te schatten parameter, de verwachtingswaarde van de schatter altijd gelijk moet zijn aan de werkelijke waarde. De 'uniform beste zuivere schatter' is daarbij de schatter die voor alle mogelijke parameterwaarde de kleinste variantie heeft van alle zuivere schatters.

Voorbeelden

Laat een aselecte steekproef zijn uit een populatie of kansverdeling.

Binomiale verdeling: B(n,p). De te schatten parameter is de succeskans (populatiefractie) p. Laat X het aantal successen in de steekproef zijn, dan kan p geschat worden door o.a. de schatters: (de steekproeffractie), en .

Uniforme verdeling op het interval [0,M]. De te schatten parameter is de bovengrens M. Geschikte schatters zijn: maxXi (de bovengrens in de steekproef) en max Xi.

Willekeurige populatie (of verdeling) met populatiegemiddelde en populatievariantie . Goede schatters zijn de overeenkomstige grootheden in de steekproef. Het steekproefgemiddelde als schatter voor , en de steekproefvariantie voor .