Variantie

Uit Wikipedia, de vrije encyclopedie

Ga naar: navigatie, zoeken

De variantie is in de statistiek een maat voor de spreiding van de betrokken waarden. Onder de spreiding van de waarden verstaat men de mate waarin de waarden onderling verschillen. Hoe groter de variantie, hoe meer de afzonderlijke waarden onderling verschillen, en dus ook hoe meer de waarden van het "gemiddelde" afwijken. De variantie meet min of meer het gemiddelde van het kwadraat van deze afwijkingen. Die waarden kunnen de waarden van een populatie zijn, dan spreekt men van de populatievariantie. Betreft het de waarden van een verdeling, dan is de variantie een maat voor de "breedte" van deze verdeling, en spreekt men meestal gewoon van de variantie van deze verdeling. Betreft het de uitkomsten van een steekproef, dan spreekt men van steekproefvariantie.

Inhoud

[bewerken] Populatie

De populatievariantie, meestal aangeduid met σ2 is gedefinieerd als de gemiddelde kwadratische afwijking van het populatiegemiddelde μ.

\sigma^2 =\frac 1N \sum_{i=1}^N (x_i - \mu)^2,

met N de populatie-omvang, xi de populatie-elementen.

Er is een kortere rekenformule:

\sigma^2  = \frac 1N \sum x_i^2 - \mu^2,

(zie Berekening 1 onderaan dit artikel voor een bewijs).

[bewerken] Kansverdeling

Als de populatieverdeling gegeven is als kansverdeling van een stochastische variabele X, is de variantie (van X) gedefinieerd als de verwachtingswaarde van de kwadratische afwijkingen van de verwachtingswaarde van X:

 \mathrm{var}(X) = E(X-EX)^2\,.

Ook hier is weer een alternatieve rekenformule:

 \mathrm{var}(X) = EX^2-(EX)^2\,.

[bewerken] Steekproef

Om de variantie in een populatie of kansverdeling te berekenen zijn alle waarden nodig. Vaak zijn die echter niet beschikbaar en wordt de variantie geschat aan de hand van een aselecte steekproef. Men berekent als schatting de steekproefvariantie, aangeduid door s2 en gedefinieerd door:

s^2 = \frac 1{n-1}\sum_{i=1}^n (x_i - \bar{x})^2

Hierin is n de steekproefgrootte, xi de steekproefelementen en \bar{x} het steekproefgemiddelde.

Ook voor s2 is er een kortere rekenformule:

s^2 = \frac 1{n-1}\sum x_i^2 - \frac n{n-1}\bar{x}^2

Kent men de som van de waarden en van de kwadraten daarvan, dan kan ook geschreven worden:

s^2 = \frac 1{n-1}\left( \sum{x_i^2} - \frac 1n (\sum{x_i})^2 \right)

De zo gedefinieerde steekproefvariantie is een zogeheten zuivere schatter van de variantie. Dat houdt in dat bij veel herhalingen, het gemiddelde van de schattingen convergeert naar de te schatten variantie.

In de Nederlandse statistische terminologie wordt echter ook de schatter:

s_n^2 = \frac 1n\sum_{i=1}^n (x_i - \bar{x})^2

als steekproefvariantie aangeduid. Deze schatter die daadwerkelijk het gemiddelde van de kwadratische afwijkingen van het steekproefgemiddelde berekent, kan opgevat worden als de populatievariantie van de steekproef als populatie. Zoals gemakkelijk te zien is, scheelt deze schatter slechts een factor (n-1)/n van de eerder genoemde. Praktisch gezien, en zeker als de steekproefomvang n groot is, is er weinig verschil tussen beide schatters. De schatter sn is natuurlijk niet meer zuiver. Echter is het de zogenaamde meest aannemelijke schatter van de variantie in het geval van een normale verdeling.

Omdat zowel zuiverheid als meest aannemelijkheid van een schatter theoretisch belangrijke eigenschappen zijn, heeft verschil van opvatting daarover tussen de hoogleraren statistiek destijds, ertoe geleid dat beide schatters de naam steekproefvariantie hebben.

[bewerken] Terminologie

De populatievariantie is een parameter (eigenschap) van de populatie; de steekproefvariantie s2 is een steekproeffunctie, een schatter van de populatievariantie. De wortel uit de variantie wordt standaardafwijking genoemd.

[bewerken] Voorbeeld

Een steekproef ter grootte van n=5 levert de resultaten 1, 2, 3, 4, 5. Dus \bar{x}=3. De variantie is

s^2 = \frac{1}{5-1}\left((1-3)^2+(2-3)^2+(3-3)^2+(4-3)^2+(5-3)^2\right)

 = \tfrac 14\left(4+1+0+1+4\right)=2\tfrac12.

[bewerken] Analogie

In de mechanica is het analogon van de variantie het traagheidsmoment van een voorwerp, dus van een massaverdeling.

Het elektrische vermogen (natuurkunde) van een zuivere wisselstroom, dus gemiddeld 0, is evenredig met het gemiddelde kwadraat van de spanning, dus een constante maal de variantie van dat signaal.

[bewerken] Berekening 1

In het artikel wordt de populatievariantie gedefinieerd als:

\sigma^2 =\frac 1N \sum_{i=1}^N (x_i - \mu)^2,

met N de populatie-omvang, xi de populatie-elementen en μ het gemiddelde van de populatie.
En vervolgens wordt gesteld dat dit gelijk is aan

\frac 1N \sum_{i=1}^N x_i^2 - \mu^2.

Hieronder wordt aangetoond dat deze laatste bewering inderdaad correct is.

Daartoe berekenen we:

\sum (x_i - \mu)^2 = 
\sum (x_i^2 - 2\cdot x_i\cdot \mu + \mu^2) = 
(\sum x_i^2) - (2 \mu \sum x_i) + (\sum \mu^2) = 
(\sum x_i^2) - 2 \mu N \mu + N \mu^2 = 
\sum x_i^2 - N \mu^2

Links en rechts delen door N geeft het gezochte resultaat.


 
Persoonlijke instellingen
Boek maken