Kwantiel

Uit Wikipedia, de vrije encyclopedie
Ga naar: navigatie, zoeken

In de statistiek is een kwantiel een getal dat een dataset verdeelt in twee delen, de kleinere en de grotere waarden. De dataset kan een concrete of abstracte populatie zijn of de uitkomsten van een steekproef. Voor het getal p, 0 < p < 1, geeft het p-kwantiel een verdeling in een deel met de kleinere waarden ter grootte p en een deel met de grotere waarden ter grootte 1-p van de totale omvang. Bekend is het 0,5-kwantiel, de mediaan genaamd, die het midden is van een geordende dataset.

Definitie[bewerken]

Voor een kenmerk X van een abstracte populatie gegeven door een kansverdeling is het p-kwantiel xp het gemiddelde van de getallen a waarvoor geldt:

P(X\le a)\ge p

en

P(X\ge a)\ge 1-p

De laatste eis laat zich ook schrijven als:

P(X  < a)\le p.

In een continue verdeling ligt een kwantiel door deze eisen eenduidig vast. In een discrete verdeling kunnen twee aangrenzende uitkomsten (en ook alle tussenliggende getallen) aan de eisen voldoen. Als kwantiel wordt dan het midden tussen beide mogelijkheden gekozen.

Voor een concrete populatie of een steekproef, bestaande uit n getallen x1, ..., xn, waaronder mogelijk gelijke, wordt het p-kwantiel xp bepaald door de eisen:

  • ten minste pn van de data zijn kleiner dan of gelijk aan xp.
  • ten minste (1-p)n van de data zijn groter dan of gelijk aan xp.

Hier geldt hetzelfde als in een discrete verdeling: als twee aangrenzende uitkomsten aan de eisen voldoen, neemt men het gemiddelde van beide als kwantiel.

In een abstracte of concrete populatie is een kwantiel een parameter van de populatie. In een steekproef is een kwantiel een schatting van het overeenkomstige kwantiel in de populatie waaruit de steekproef getrokken is.

Voorbeelden[bewerken]

Het 0,2-kwantiel x0,20 in een exponentiële verdeling met parameter 1 wordt bepaald door de vergelijking:

0{,}20=F(x_{0{,}20})=1-\mathrm{e}^{-x_{0{,}20}},

waaruit volgt:

x_{0{,}20}=-\ln(0{,}80)=\ln(5)-\ln(4)\,.


Het 0,2-kwantiel van de (geordende) dataset:

2,3,5,7,8,9,11,12,15\,

is het getal 3. Er zijn 2, dus ten minste 1,8 getallen kleiner of gelijk aan 3 en er zijn 8, dus ten minste 7,2 getallen groter of gelijk aan 3.

Van de dataset:

2,3,5,7,8,9,11,12,15,20\,

voldoen zowel 3 als 5 aan de eisen. Het 0,2-kwantiel kwantiel is dus (3+5)/2 = 4. We zien ook dat 4 mooi de dataset in een deel van 2 en een deel van 8 getallen scheidt.

Formule[bewerken]

Als de dataset een eindige populatie of een steekproefuitkomst betreft van n elementen, is het p-kwantiel het "element" met als rangnummer in de geordende data:

pn+ \tfrac 12.

Het woord "element" staat tussen aanhalingstekens, want niet altijd is dit rangnummer een geheel getal. Als kwantiel wordt dan het gemiddelde van de omliggende elementen gekozen.

Speciale kwantielen[bewerken]

De kwantielen de horen bij een verdeling in een 2, 4, 10 en 100 delen hebben een aparte naam. Bij een verdeling in: