Kwartiel

Uit Wikipedia, de vrije encyclopedie

In de statistiek is een kwartiel een van de drie waarden die een geordende set data, de steekproef of populatie, in vier (zo goed mogelijk) gelijke delen opdeelt. Elk deel is in dat geval een kwart van de dataset. Men spreekt van eerste, tweede en derde kwartiel en noteert deze als , en .

In deze systematiek worden de uitersten van de dataset, het minimum en het maximum wel genoteerd als en . Met de zo bepaalde vijf kwartielen kan een dataset kort samengevat worden in wat de vijf-getallensamenvatting heet.

Definitie[bewerken | brontekst bewerken]

Kwartielen van een set data[bewerken | brontekst bewerken]

Voor het eerste kwartiel geldt:

  • ten minste 1/4 van de data is niet groter dan
  • ten minste 3/4 van de data is niet kleiner dan

Voor het tweede kwartiel geldt:

  • ten minste 1/2 van de data is niet groter dan
  • ten minste 1/2 van de data is niet kleiner dan

Voor het derde kwartiel geldt:

  • ten minste 3/4 van de data is niet groter dan
  • ten minste 1/4 van de data is niet kleiner dan

Formeel genoteerd geldt dus voor de kwartielen van de data :

Kwartielen van een kansverdeling[bewerken | brontekst bewerken]

Voor de kwartielen van de kansverdeling van een stochastische variabele geldt:

  • ;
  • .

Bepaling[bewerken | brontekst bewerken]

De bovenstaande definitie bepaalt niet in alle gevallen eenduidig de kwartielen. In het geval van een eindige dataset bijvoorbeeld die bestaat uit 8 data, delen de kwartielen weliswaar de dataset in precies vier gelijke delen, maar zijn de kwartielen niet eenduidig bepaald. Voor het eerste kwartiel komen alle getallen in aanmerking tussen de tweede en derde in grootte. Voor de hand liggend is het gemiddelde van het 2e en het 3e getal als te kiezen, maar men moet zich terdege realiseren dat er daarbij sprake is van een keuze. Is het aantal data geen viervoud, dan is een verdeling van de dataset in vier gelijke delen onmogelijk. Ook in dat geval moet men kiezen voor een specifieke methode voor het bepalen van de kwartielen.

Er zijn meerdere methoden bekend voor het berekenen van de kwartielen. In ieder statistisch softwarepakket is gekozen voor een specifiek algoritme, waardoor verschillende pakketten ook verschillende waarden voor de kwartielen kunnen leveren.

Kwartielen vormen een bijzonder geval van percentielen. In het lemma over percentielen worden tien verschillende methoden voor het berekenen van percentielen, en dus ook van kwartielen, gegeven. Zie ook de website van Mathworld.

Een van de methoden waarmee kwartielen worden berekend[bewerken | brontekst bewerken]

Een veel gebruikte manier om van een geordende set van data de kwartielen te bepalen is als volgt:

,

daarin is de nintfunctie, voor het afronden naar de dichtstbijzijnde gehele waarde.

Interkwartielafstand[bewerken | brontekst bewerken]

Het verschil tussen het eerste en het derde kwartiel wordt interkwartielafstand genoemd, een maat voor de spreiding van de data.

Zie ook[bewerken | brontekst bewerken]

  • kwintielen, die de set in 5 gelijke delen opdelen;
  • decielen die de set in 10 gelijke delen opdelen;
  • percentielen, die de set in 100 gelijke delen opdelen

Externe link[bewerken | brontekst bewerken]