Variantie
Uit Wikipedia, de vrije encyclopedie
De variantie is in de statistiek een maat voor de spreiding van de betrokken waarden. Onder de spreiding van de waarden verstaat men de mate waarin de waarden onderling verschillen. Hoe groter de variantie, hoe meer de afzonderlijke waarden onderling verschillen, en dus ook hoe meer de waarden van het "gemiddelde" afwijken. De variantie meet min of meer het gemiddelde van het kwadraat van deze afwijkingen. Die waarden kunnen de waarden van een populatie zijn, dan spreekt men van de populatievariantie. Betreft het de waarden van een verdeling, dan is de variantie een maat voor de "breedte" van deze verdeling, en spreekt men meestal gewoon van de variantie van deze verdeling. Betreft het de uitkomsten van een steekproef, dan spreekt men van steekproefvariantie.
Inhoud |
[bewerken] Populatie
De populatievariantie, meestal aangeduid met σ2 is gedefinieerd als de gemiddelde kwadratische afwijking van het populatiegemiddelde μ.
,
met N de populatie-omvang, xi de populatie-elementen.
Er is een kortere rekenformule:
,
(zie Berekening 1 onderaan dit artikel voor een bewijs).
[bewerken] Kansverdeling
Als de populatieverdeling gegeven is als kansverdeling van een stochastische variabele X, is de variantie (van X) gedefinieerd als de verwachtingswaarde van de kwadratische afwijkingen van de verwachtingswaarde van X:
.
Ook hier is weer een alternatieve rekenformule:
.
[bewerken] Steekproef
Om de variantie in een populatie of kansverdeling te berekenen zijn alle waarden nodig. Vaak zijn die echter niet beschikbaar en wordt de variantie geschat aan de hand van een aselecte steekproef. Men berekent als schatting de steekproefvariantie, aangeduid door s2 en gedefinieerd door:
Hierin is n de steekproefgrootte, xi de steekproefelementen en
het steekproefgemiddelde.
Ook voor s2 is er een kortere rekenformule:
Kent men de som van de waarden en van de kwadraten daarvan, dan kan ook geschreven worden:
De zo gedefinieerde steekproefvariantie is een zogeheten zuivere schatter van de variantie. Dat houdt in dat bij veel herhalingen, het gemiddelde van de schattingen convergeert naar de te schatten variantie.
In de Nederlandse statistische terminologie wordt echter ook de schatter:
als steekproefvariantie aangeduid. Deze schatter die daadwerkelijk het gemiddelde van de kwadratische afwijkingen van het steekproefgemiddelde berekent, kan opgevat worden als de populatievariantie van de steekproef als populatie. Zoals gemakkelijk te zien is, scheelt deze schatter slechts een factor (n-1)/n van de eerder genoemde. Praktisch gezien, en zeker als de steekproefomvang n groot is, is er weinig verschil tussen beide schatters. De schatter sn is natuurlijk niet meer zuiver. Echter is het de zogenaamde meest aannemelijke schatter van de variantie in het geval van een normale verdeling.
Omdat zowel zuiverheid als meest aannemelijkheid van een schatter theoretisch belangrijke eigenschappen zijn, heeft verschil van opvatting daarover tussen de hoogleraren statistiek destijds, ertoe geleid dat beide schatters de naam steekproefvariantie hebben.
[bewerken] Terminologie
De populatievariantie is een parameter (eigenschap) van de populatie; de steekproefvariantie s2 is een steekproeffunctie, een schatter van de populatievariantie. De wortel uit de variantie wordt standaardafwijking genoemd.
[bewerken] Voorbeeld
Een steekproef ter grootte van n=5 levert de resultaten 1, 2, 3, 4, 5. Dus
. De variantie is

.
[bewerken] Analogie
In de mechanica is het analogon van de variantie het traagheidsmoment van een voorwerp, dus van een massaverdeling.
Het elektrische vermogen (natuurkunde) van een zuivere wisselstroom, dus gemiddeld 0, is evenredig met het gemiddelde kwadraat van de spanning, dus een constante maal de variantie van dat signaal.
[bewerken] Berekening 1
In het artikel wordt de populatievariantie gedefinieerd als:
,
met N de populatie-omvang, xi de populatie-elementen en μ het gemiddelde van de populatie.
En vervolgens wordt gesteld dat dit gelijk is aan
.
Hieronder wordt aangetoond dat deze laatste bewering inderdaad correct is.
Daartoe berekenen we:
Links en rechts delen door N geeft het gezochte resultaat.
| Onderwerpen uit de beschrijvende statistiek |
|---|
|
Gemiddelden: Rekenkundig gemiddelde · Meetkundig gemiddelde · Harmonisch gemiddelde · Kwadratisch gemiddelde · Gewogen gemiddelde · Getrimd gemiddelde · Winsorgemiddelde |










