Kwartiel

Uit Wikipedia, de vrije encyclopedie
Ga naar: navigatie, zoeken

In de statistiek is een kwartiel een van de drie waarden die een geordende set data, de steekproef of populatie, in vier (zo goed mogelijk) gelijke delen opdeelt. Elk deel is in dat geval een kwart van de dataset. Men spreekt van eerste, tweede en derde kwartiel en noteert deze als Q1, Q2 en Q3.

In deze systematiek worden de uitersten van de dataset, het minimum en het maximum wel genoteerd als Q0 en Q4. Met de zo bepaalde vijf kwartielen kan een dataset kort samengevat worden in wat de vijf-getallensamenvatting heet.

Definitie[bewerken]

Voor het eerste kwartiel Q1 geldt:

  • ten minste 1/4 van de data is niet groter dan Q1
  • ten minste 3/4 van de data is niet kleiner dan Q1

Voor het tweede kwartiel Q2 geldt:

  • ten minste 1/2 van de data is niet groter dan Q2
  • ten minste 1/2 van de data is niet kleiner dan Q2

Voor het derde kwartiel Q3 geldt:

  • ten minste 3/4 van de data is niet groter dan Q3
  • ten minste 1/4 van de data is niet kleiner dan Q3

Voor de kwartielen van de kansverdeling van een stochastische variabele X geldt:

  • P(X\le Q_i) \ge \frac i4;
  • P(X\ge Q_i) \ge 1-\frac i4.

Bepaling[bewerken]

De bovenstaande definitie bepaalt niet in alle gevallen eenduidig de kwartielen. In het geval van een eindige dataset bijvoorbeeld die bestaat uit 8 data, delen de kwartielen weliswaar de dataset in precies vier gelijke delen, maar zijn de kwartielen niet eendiudig bepaald. Voor het eerste kwartiel komen alle getallen in aanmerking tussen de tweede en derde in grootte. Voor de hand liggend is het gemiddelde van het 2e en het 3e getal als Q1 te kiezen, maar men moet zich terdege realiseren dat er daarbij sprake is van een keuze. Is het aantal data geen viervoud, dan is een verdeling van de dataset in vier gelijke delen onmogelijk. Ook in dat geval moet men kiezen voor een specifieke methode voor het bepalen van de kwartielen.

Er zijn meerdere methoden bekend voor het berekenen van de kwartielen. In ieder statistisch softwarepakket is gekozen voor een specifiek algoritme, waardoor verschillende pakketten ook verschillende waarden voor de kwartielen kunnen leveren.

Kwartielen vormen een bijzonder geval van percentielen. In het lemma over percentielen worden tien verschillende methoden voor het berekenen van percentielen, en dus ook van kwartielen, gegeven. Zie ook de website van Mathworld.

Een van de methoden waarmee kwartielen worden berekend[bewerken]

Een veel gebruikte manier om van een geordende set x_{(1)}\le \ldots \le x_{(n)} van n data de kwartielen te bepalen is als volgt:

Q_1= x_{(k)}, \text{met } k=\left\lbrack \tfrac{n+1}{4}\right\rbrack
Q_2= x_{(k)}, \text{met } k=\left\lbrack \tfrac{n+1}{2}\right\rbrack
Q_3= x_{(k)}, \text{met } k=\left\lbrack \tfrac{3n+3}{4}\right\rbrack,

daarin is [.] de nintfunctie, voor het afronden naar de dichtstbijzijnde gehele waarde.

Interkwartielafstand[bewerken]

Het verschil tussen het eerste en het derde kwartiel Q3 - Q1 wordt interkwartielafstand genoemd, een maat voor de spreiding van de data.

Zie ook[bewerken]

  • kwintielen, die de set in 5 gelijke delen opdelen;
  • decielen die de set in 10 gelijke delen opdelen;
  • percentielen, die de set in 100 gelijke delen opdelen

Externe link[bewerken]