Kurtosis

Uit Wikipedia, de vrije encyclopedie
Ga naar: navigatie, zoeken

In de kansrekening en de statistiek is het begrip kurtosis (Grieks: κύρτωσις, kurtosis, welven, krommen) of welving (gewelfdheid), (ook wel platheid genoemd) een maat voor de 'piekvormigheid' van een kansverdeling. Zowel de parameter zelf als de schatter daarvan worden met kurtosis aangeduid. Een hoge kurtosis wijst op een verdeling met een sterke piek. Dit houdt in dat een relatief groot deel van de variantie veroorzaakt wordt door zeldzame extreme waarden. Een lage kurtosis wijst op een platte verdeling. Hier wordt de variantie voornamelijk veroorzaakt door een groter deel minder extreme waarden.

Definitie[bewerken]

Voor kurtosis worden in de statistische literatuur twee verschillende definities gebruikt. Als eerste, wordt kurtosis gedefinieerd als het vierde gestandaardiseerde moment:


\gamma'_2 = \frac{\mu_4}{\sigma^4} = \frac{\operatorname{E}[(X-{\mu})^4]}{(\operatorname{E}[(X-{\mu})^2])^2}

waarin \mu_4={\rm E}(X-\mu)^4 het vierde centrale moment is, en σ de standaarddeviatie.

Voor een normale verdeling is \gamma'_2 = 3. Om vergelijking met de normale verdeling te vergemakkelijken, wordt algemeen de volgende definitie van kurtosis gehanteerd, die ook wel exces kurtosis genoemd wordt.

\gamma_2 = \gamma'_2 - 3.

Een wiskundige theoretische reden voor deze aangepaste definitie is dat de kurtosis nu gelijk is aan het quotiënt van het vierde cumulant (\kappa_4) en het kwadraat van de tweede cumulant (\kappa_2, die gelijk is aan de variantie).

\gamma_2 = \frac{\kappa_4}{\kappa_2^2}.

Een praktische reden is dat volgens deze formule, de normale verdeling een kurtosis gelijk aan nul heeft.

  • Een positieve kurtosis duidt op een stevige piekvorm van de kansverdeling, dit wordt leptokurtosisch genoemd. Voorbeelden van leptokurtosische verdelingen zijn de Laplaceverdeling en de logistische verdeling.
  • Een negatieve kurtosis duidt op een platte vorm van de kansverdeling, dit wordt platykurtosisch genoemd. Voorbeelden hiervan zijn de uniforme verdeling. De meest platykurtosische verdeling is de Bernoulli-verdeling met parameter p = 1/2, deze heeft een kurtosis van -2.
  • Verdelingen met kurtosis 0 worden mesokurtosisch genoemd. Voorbeelden hiervan zijn de normale verdelingen.

Eigenschappen[bewerken]

  • Als X een normale verdeling volgt, dan is γ2(X) = 0.
  • Als Y de som is van n onafhankelijke, identiek verdeelde toevalsgrootheden X, dan is γ2(Y) = γ2(X)/n
  • Als X1, ..., Xn onafhankelijke toevalsgrootheden zijn, allen met dezelfde variantie, dan geldt dat \gamma_2(\sum_{i=1}^n X_i) = \sum_{i=1}^n (\gamma_2(X_i))/n^2.

NB: deze drie eigenschappen gelden voor γ2 en niet voor γ'2.

Steekproefkurtosis[bewerken]

De kurtosis van een verdeling kan geschat worden op basis van de uitkomst x_1,\ldots,x_n van een aselecte steekproef uit de verdeling. De steekproefkurtosis is de momentschatter van de kurtosis:


g_2 = \frac{n\,\sum_{i=1}^n (x_i - \overline{x})^4}{\left(\sum_{i=1}^n (x_i - \overline{x})^2\right)^2} - 3

waarin \overline{x} het steekproefgemiddelde is.

Omdat dit geen zuivere schatter voor de populatiekurtosis is, wat wil zeggen dat {\rm E}g_2 \neq \gamma_2, wordt in praktijk, en in de meeste softwarepakketten, meestal de volgende, wel zuivere, schatter gebruikt

G_2 = \frac{n-1}{(n-2) (n-3)} \left( (n+1)\,g_2 + 6 \right).