Kwantiel

Uit Wikipedia, de vrije encyclopedie
Naar navigatie springen Naar zoeken springen

In de statistiek is een kwantiel een getal dat een dataset verdeelt in twee delen, de kleinere en de grotere waarden. De dataset kan een concrete of abstracte populatie zijn of de uitkomsten van een steekproef. Voor het getal , geeft het -kwantiel een verdeling in een deel met de kleinere waarden ter grootte en een deel met de grotere waarden ter grootte van de totale omvang. Bekend is het 0,5-kwantiel, de mediaan genaamd, die het midden is van een geordende dataset.

Definitie[bewerken | brontekst bewerken]

Voor een kenmerk van een abstracte populatie gegeven door een kansverdeling is het getal een -kwantiel als:

en

In het bijzonder kunnen dus meerdere -kwantielen bestaan. Om eenduidigheid af te dwingen wordt door sommige auteurs het gemiddelde van de mogelijke waarden die als kwantiel in aanmerking komen, als kwantiel gedefiniererd.

Voor een concrete populatie of een steekproef, bestaande uit getallen , waaronder mogelijk gelijke, wordt het -kwantiel bepaald door de eisen:

  • ten minste van de data zijn kleiner dan of gelijk aan .
  • ten minste van de data zijn groter dan of gelijk aan .

Hier geldt hetzelfde als in een discrete verdeling: als twee aangrenzende uitkomsten aan de eisen voldoen, neemt men het gemiddelde van beide als kwantiel.

In een abstracte of concrete populatie is een kwantiel een parameter van de populatie. In een steekproef is een kwantiel een schatting van het overeenkomstige kwantiel in de populatie waaruit de steekproef getrokken is.

Voorbeelden[bewerken | brontekst bewerken]

Het 0,20-kwantiel in een exponentiële verdeling met parameter 1 wordt bepaald door de vergelijking:

,

waaruit volgt:


Het 0,2-kwantiel van de (geordende) dataset:

is het getal 3. Er zijn 2, dus ten minste 1,8 getallen kleiner dan of gelijk aan 3 en er zijn 8, dus ten minste 7,2 getallen groter dan of gelijk aan 3.

Van de dataset:

voldoen zowel 3 als 5 aan de eisen. Het 0,2-kwantiel kwantiel is dus (3+5)/2 = 4. We zien ook dat 4 mooi de dataset in een deel van 2 en een deel van 8 getallen scheidt.

Formule[bewerken | brontekst bewerken]

Als de dataset een eindige populatie of een steekproefuitkomst betreft van elementen, is het -kwantiel het "element" met als rangnummer in de geordende data:

Het woord "element" staat tussen aanhalingstekens, want niet altijd is dit rangnummer een geheel getal. Als kwantiel wordt dan het gemiddelde van de omliggende elementen gekozen.

Speciale kwantielen[bewerken | brontekst bewerken]

De kwantielen die behoren bij een verdeling in 2, 4, 10 of 100 delen hebben een aparte naam. Bij een verdeling in: