Naar inhoud springen

Schatten: verschil tussen versies

Uit Wikipedia, de vrije encyclopedie
Verwijderde inhoud Toegevoegde inhoud
Versie 46928333 van 193.191.216.76 (overleg) ongedaan gemaakt: bekend, met een rode link?
Madyno (overleg | bijdragen)
Geen bewerkingssamenvatting
 
Regel 9: Regel 9:


== Voorbeelden ==
== Voorbeelden ==
Een vreemde [[munt (betaalmiddel)|munt]] ziet er niet bepaald symmetrisch uit, zodat de [[kansrekening|kans]] p op kop vermoedelijk niet <math>\begin{matrix}\frac 12\end{matrix}</math> zal zijn. Daarom gooien we 10 keer met de munt. Stel dat we in deze steekproef 3 keer kop vinden. We zouden dan de onbekende parameter p (de [[populatiefractie]]) kunnen schatten door de [[steekproeffractie]] <math>\begin{matrix}\frac 3{10}\end{matrix}</math> .
Een vreemde [[munt (betaalmiddel)|munt]] ziet er niet bepaald symmetrisch uit, zodat de [[kansrekening|kans]] <math>p</math> op [[Kruis of munt|kruis]] vermoedelijk niet <math>\tfrac 12</math> zal zijn. Daarom gooien we 10 keer met de munt. Stel dat we in deze steekproef 3 keer kruis vinden. We zouden dan de onbekende parameter <math>p</math> (de [[populatiefractie]]) kunnen schatten door de [[steekproeffractie]] <math>\tfrac{3}{10}</math>.


Een ander voorbeeld is bekend uit de [[Tweede Wereldoorlog]]. Het viel de Engelsen op dat Duits oorlogsmaterieel, zoals neergehaalde Duitse [[bommenwerper]]s, banden van voertuigen en [[versnellingsbak]]ken van [[tank (voertuig)|tank]]s, "gründlich" voorzien was van een serienummer. Op grond van de gevonden serienummers in de "steekproef" gaven statistici een schatting van de totale (maandelijkse) productie ''N''. Het zal duidelijk zijn dat alleen het hoogste gevonden nummer ''M'' van belang is, d.w.z. een goede schatter zal alleen afhankelijk zijn van ''M'' . Men kan laten zien dat bij een steekproefomvang ''n'', een goede schatting van ''N'' gegeven wordt door:
Een ander voorbeeld is bekend uit de [[Tweede Wereldoorlog]]. Het viel de Engelsen op dat Duits oorlogsmaterieel, zoals neergehaalde Duitse [[bommenwerper]]s, banden van voertuigen en [[versnellingsbak]]ken van [[tank (voertuig)|tanks]], "gründlich" voorzien was van een serienummer. Op grond van de gevonden serienummers in de "steekproef" gaven statistici een schatting van de totale (maandelijkse) productie <math>N</math>. Het zal duidelijk zijn dat alleen het hoogste gevonden nummer <math>M</math> van belang is, d.w.z. een goede schatter zal alleen afhankelijk zijn van <math>M</math>. Men kan laten zien dat bij een steekproefomvang <math>n</math>, een goede schatting van <math>N</math> gegeven wordt door:
:<math>\hat N = \left(1+\frac 1n\right) M - 1</math>


:<math>\hat N = \left(1+\frac 1n\right) M - 1.</math>
Omdat
Omdat
:<math>{\rm E}M=\frac n{n+1}(N+1)</math> en dus <math>{\rm E}\hat N = N</math>,
:<math>{\rm E}M=\frac n{n+1}(N+1)</math>
en dus
:<math>{\rm E}\hat N = N</math>,
is <math>\hat N </math> een [[zuivere schatter]].


Overigens gebruikten de statistici een iets andere schatter, die voor grote steekproeven praktisch gelijk is aan <math>\hat N.</math>. Na de oorlog bleek dat de schattingen tamelijk nauwkeurig waren, in tegenstelling tot de ramingen van de geheime dienst, die factoren 5 à 7 te hoog waren.
is <math>\hat N </math> een [[zuivere schatter]] van <math>N</math>.
Overigens gebruikten de statistici een iets andere schatter, die voor grote steekproeven praktisch gelijk is aan <math>\hat N</math>. Na de oorlog bleek dat de schattingen tamelijk nauwkeurig waren, in tegenstelling tot de ramingen van de geheime dienst, die factoren 5 à 7 te hoog waren.


==Schatter==
==Schatter==
Regel 24: Regel 27:


===Voorbeelden===
===Voorbeelden===
Laat <math>\scriptstyle X_1, \dots , X_n</math> een [[aselect]]e steekproef zijn uit een populatie of kansverdeling.
Laat <math>X_1, \ldots , X_n</math> een [[aselect]]e steekproef zijn uit een populatie of kansverdeling.
:'''Binomiale verdeling''': B(''n,p''). De te schatten parameter is de succeskans (populatiefractie) ''p''. Laat ''X'' het aantal successen in de steekproef zijn, dan kan ''p'' geschat worden door o.a. de schatters: <math>X/n</math> (de steekproeffractie), <math>X/(n+1)</math> en <math>(X+1)/(n+2)</math>.<br /><br />
:'''Binomiale verdeling''': <math>B(n,p)</math>. De te schatten parameter is de succeskans (populatiefractie) <math>p</math>. Laat <math>X</math> het aantal successen in de steekproef zijn, dan kan <math>p</math> geschat worden door o.a. de schatters: <math>X/n</math> (de steekproeffractie), <math>X/(n+1)</math> en <math>(X+1)/(n+2)</math>.

:'''Uniforme verdeling''' op het interval [0,M]. De te schatten parameter is de bovengrens ''M''. Geschikte schatters zijn: max{{math|X{{sub|i}}}} (de bovengrens in de steekproef) en <math>\scriptstyle (1+\tfrac 1n)</math>max {{math|X{{sub|i}}}}.<br /><br />
:'''Uniforme verdeling''' op het interval <math>[0,M]</math>. De te schatten parameter is de bovengrens <math>M</math>. Geschikte schatters zijn: <math>\mathrm{max}(X_i)</math> (de bovengrens in de steekproef) en <math>(1+1/n)\cdot\mathrm{max}(X_i)</math>.

:'''Willekeurige populatie''' (of verdeling) met populatie[[gemiddelde]] <math>\mu</math> en populatie[[variantie]] <math>\sigma^2</math>. Goede schatters zijn de overeenkomstige grootheden in de steekproef. Het [[steekproefgemiddelde]] als schatter voor <math>\mu</math>, en de [[steekproefvariantie]] voor <math>\sigma^2</math>.
:'''Willekeurige populatie''' (of verdeling) met populatie[[gemiddelde]] <math>\mu</math> en populatie[[variantie]] <math>\sigma^2</math>. Goede schatters zijn de overeenkomstige grootheden in de steekproef. Het [[steekproefgemiddelde]] als schatter voor <math>\mu</math>, en de [[steekproefvariantie]] voor <math>\sigma^2</math>.



Huidige versie van 11 dec 2019 om 18:45

Een categorie van methoden die de statistiek hanteert om informatie te verkrijgen, wordt gevormd door de schattingsmethoden. Een onbekende parameter van een populatie (of verdeling) wordt geschat door een uit de steekproef berekende grootheid, de schatting. Het voorschrift dat bepaalt hoe de schatting uit de steekproef moet worden berekend, wordt schatter genoemd.

Algemeen bekend is het (steekproef-)gemiddelde als schatting voor het populatiegemiddelde (of de verwachtingswaarde).

Schattingsmethoden

[bewerken | brontekst bewerken]

Bekende schattingsmethoden zijn:

Een vreemde munt ziet er niet bepaald symmetrisch uit, zodat de kans op kruis vermoedelijk niet zal zijn. Daarom gooien we 10 keer met de munt. Stel dat we in deze steekproef 3 keer kruis vinden. We zouden dan de onbekende parameter (de populatiefractie) kunnen schatten door de steekproeffractie .

Een ander voorbeeld is bekend uit de Tweede Wereldoorlog. Het viel de Engelsen op dat Duits oorlogsmaterieel, zoals neergehaalde Duitse bommenwerpers, banden van voertuigen en versnellingsbakken van tanks, "gründlich" voorzien was van een serienummer. Op grond van de gevonden serienummers in de "steekproef" gaven statistici een schatting van de totale (maandelijkse) productie . Het zal duidelijk zijn dat alleen het hoogste gevonden nummer van belang is, d.w.z. een goede schatter zal alleen afhankelijk zijn van . Men kan laten zien dat bij een steekproefomvang , een goede schatting van gegeven wordt door:

Omdat

en dus

,

is een zuivere schatter van .

Overigens gebruikten de statistici een iets andere schatter, die voor grote steekproeven praktisch gelijk is aan . Na de oorlog bleek dat de schattingen tamelijk nauwkeurig waren, in tegenstelling tot de ramingen van de geheime dienst, die factoren 5 à 7 te hoog waren.

Het schatten van een parameter van een populatie of kansverdeling gebeurt door middel van een schatter, dat is een steekproeffunctie: een functie die uit de steekproef een getal, de schatting, berekent. Hoewel iedere steekproeffunctie aangemerkt kan worden als schatter, is het zaak goede schatters te vinden. Een goede schatter zal schattingen vinden die in bepaalde zin niet veel afwijken van de onbekende waarde van de parameter. Een bijzondere groep van 'goede' schatters zijn de zuivere schatters. Zuivere schatter zijn schatters die gemiddeld, over alle mogelijke steekproeven, precies de waarde van de te schatten parameter opleveren. Preciezer gezegd: een schatter is zuiver wanneer de verwachtingswaarde van de schatter gelijk is aan de te schatten parameter. De 'uniform beste zuivere schatter' is daarbij de schatter die voor alle mogelijke parameterwaarden de kleinste variantie heeft van alle zuivere schatters.

Laat een aselecte steekproef zijn uit een populatie of kansverdeling.

Binomiale verdeling: . De te schatten parameter is de succeskans (populatiefractie) . Laat het aantal successen in de steekproef zijn, dan kan geschat worden door o.a. de schatters: (de steekproeffractie), en .
Uniforme verdeling op het interval . De te schatten parameter is de bovengrens . Geschikte schatters zijn: (de bovengrens in de steekproef) en .
Willekeurige populatie (of verdeling) met populatiegemiddelde en populatievariantie . Goede schatters zijn de overeenkomstige grootheden in de steekproef. Het steekproefgemiddelde als schatter voor , en de steekproefvariantie voor .