Kurtosis

Uit Wikipedia, de vrije encyclopedie
Ga naar: navigatie, zoeken

Het begrip kurtosis (vaak ook platheid genoemd) is een maat voor 'piekvormigheid' in de statistiek. Kurtosis is zowel te berekenen voor een kansverdeling als een steekproef. Een hoge kurtosis wijst op een verdeling, of data, met een sterke piek. Dit houdt in dat een relatief groot deel van de variantie veroorzaakt wordt door zeldzame extreme waarden. Een lage kurtosis wijst op een platte verdeling, of data. Hier wordt de variantie voornamelijk veroorzaakt door een groter deel minder extreme waarden.

Definitie[bewerken]

Voor kurtosis worden in de statistische literatuur twee verschillende definities gebruikt. Als eerste, wordt kurtosis gedefinieerd als het vierde gestandaardiseerde moment:


\gamma'_2 = \frac{\mu_4}{\sigma^4} = \frac{{\rm E}(X-\mu)^4}{({\rm E}(X-\mu)^2)^2}

waarbij \mu_4={\rm E}(X-\mu)^4 het vierde centrale moment is, en σ de standaarddeviatie.

Het meestgebruikt is de volgende definitie van kurtosis


\gamma_2 = \gamma'_2 - 3.\;

Een wiskundige theoretische reden voor deze aangepaste definitie is dat de kurtosis nu gelijk is aan het quotiënt van het vierde cumulant en het kwadraat van de variantie. Een praktische reden is dat volgens deze formule, de normale verdeling een kurtosis gelijk aan nul heeft.

  • Een positieve kurtosis duidt op een stevige piekvorm van de kansverdeling, dit wordt leptokurtosisch genoemd. Voorbeelden van leptokurtosische verdelingen zijn de Laplace verdeling en de logistische verdeling.
  • Een negatieve kurtosis duidt op een platte vorm van de kansverdeling, dit wordt platykurtosisch genoemd. Voorbeelden hiervan zijn de uniforme verdeling. De meest platykurtosische verdeling is de Bernoulli-verdeling met parameter p = 1/2, deze heeft een kurtosis van -2.
  • Verdelingen met kurtosis 0 worden mesokurtosisch genoemd. Voorbeelden hiervan zijn de normale verdelingen.

Eigenschappen[bewerken]

  • Als X een normale verdeling volgt, dan is γ2(X) = 0.
  • Als Y de som is van n onafhankelijke, identiek verdeelde toevalsgrootheden X, dan is γ2(Y) = γ2(X)/n
  • Als X1, ..., Xn onafhankelijke toevalsgrootheden zijn, allen met dezelfde variantie, dan geldt dat \gamma_2(\sum_{i=1}^n X_i) = \sum_{i=1}^n (\gamma_2(X_i))/n^2.

NB: deze drie eigenschappen gelden voor γ2 en niet voor γ'2.

Steekproefkurtosis[bewerken]

Voor een steekproef van n waarden is de steekproefkurtosis gelijk aan

 g_2 = \frac{n\,\sum_{i=1}^n (x_i - \overline{x})^4}{\left(\sum_{i=1}^n (x_i - \overline{x})^2\right)^2} - 3

waar xi de ide waarde is en \overline{x} het steekproefgemiddelde. Omdat dit geen zuivere schatter voor de populatiekurtosis is, dat wil zeggen {\rm E}g_2 \neq \gamma_2, wordt in praktijk, en in de meeste softwarepakketten, meestal de volgende, wel zuivere, schatter gebruikt

G_2 = \frac{n-1}{(n-2) (n-3)} \left( (n+1)\,g_2 + 6 \right).

Voorbeeld[bewerken]

Beschouw de steekproef 1, 2, 4, 5. Hiervoor geldt n = 4 en \bar{x}=3. De kurtosis is als volgt


g_2 = \frac{4\sum_{i=1}^4 (x_i-3)^4}{\left(\sum_{i=1}^4 (x_i-3)^2\right)^2} -3 = -1.64

en


G_2 = \frac{3}{2} ( 5\,g_2 + 6) = -3.3.