Scheefheid

Uit Wikipedia, de vrije encyclopedie
Ga naar: navigatie, zoeken
Voorbeeld van rechts-scheef verdeelde data

Het begrip scheefheid (Engels: skewness) is in de statistiek de meestgebruikte maat van asymmetrie. Scheefheid is zowel te berekenen voor een kansverdeling als een steekproef.

Scheefheid in een kansverdeling[bewerken]

De scheefheid is het derde gestandaardiseerde moment van de kansverdeling en wordt genoteerd met γ1:


\gamma_1 = \frac{\mu_3}{\sigma^3}

Hier is μ3 het derde centrale moment en σ de standaardafwijking. De scheefheid is dus ook te berekenen via


\gamma_1 = \frac{{\rm E}(X-\mu)^3}{({\rm E}(X-\mu)^2)^{3/2}}.
  • Een symmetrische verdeling heeft een scheefheid γ1 = 0. Voorbeelden van symmetrische verdelingen zijn de normale verdeling, de uniforme verdeling (discreet en continu) en de binomiale verdeling met succeskans p=1/2.
  • Een verdeling heet rechts-scheef, als deze aan de rechterkant een langere en zwaardere staart heeft dan aan de linkerkant. Deze benaming is enigszins verwarrend omdat dit automatisch inhoudt dat de meeste massa zich juist links van het gemiddelde bevindt (zie grafiek). Voor zo'n verdeling geldt dat γ1 > 0. Een voorbeeld van een rechts-scheve verdeling is de Gamma(k,θ)-verdeling, waarvoor geldt dat γ1 = 2k-1/2.
  • Wanneer de zwaardere staart zich aan de linkerkant bevindt, heet de verdeling links-scheef. Voor zo'n verdeling geldt dat γ1 < 0. Een voorbeeld van een links-scheve verdeling is de Beta(1,0)-verdeling f(x)=1/(1-x) (0 < x <1), met scheefheid γ1 ≈ -0.94.

Scheefheid in een steekproef[bewerken]

Voor een steekproef x1, ..., xn is de scheefheid te berekenen via


g_1 = \frac{\sqrt{n\,}\sum_{i=1}^n (x_i-\bar{x})^3}{\left(\sum_{i=1}^n (x_i-\bar{x})^2\right)^{3/2}},

waarbij \bar{x} het steekproefgemiddelde is. Omdat deze schatter geen zuivere schatter is, dat wil zeggen {\rm E}g_1 \neq \gamma_1, wordt in praktijk meestal de volgende, wel zuivere, schatter gebruikt


G_1 = \frac{\sqrt{n\,(n-1)}}{n-2}\; g_1.

Voorbeeld[bewerken]

Beschouw de steekproef 1, 2, 4, 8. Hiervoor geldt n = 4 en \bar{x}=3.75. De scheefheid is als volgt


g_1 = \frac{\sqrt{4\,}\sum_{i=1}^4 (x_i-3.75)^3}{\left(\sum_{i=1}^4 (x_i-3.75)^2\right)^{3/2}},
 = \frac{2 \times 50.625}{28^{3/2}} \approx 0.66,

en

G_1 = \frac{\sqrt{4\times 3}}{2} g_1 \approx 1.14.

Andere maten van asymmetrie[bewerken]

Karl Pearson suggereerde twee asymmetrie-maten die eenvoudiger te berekenen zijn:

Deze maten zijn echter minder gebruikelijk geraakt sinds de opkomst van de computer, die het berekenen van de gewone scheefheidsmaat vergemakkelijkte.