Vijf-getallensamenvatting

Uit Wikipedia, de vrije encyclopedie
Ga naar: navigatie, zoeken

De vijf-getallensamenvatting is in de beschrijvende statistiek de opsomming van de vijf kwartielen van een dataset. Daarbij worden minimum en maximum ook tot de kwartielen gerekend. De vijf kwartielen Q0, ...,Q4 verdelen de data in vier delen, van elk een kwart van de data. Uit de ligging van de kwartielen krijgen we een indruk van de vorm van de verdeling van de data. Door de grafische weergave van de vijf-getallensamenvatting in een boxplot wordt de indruk van deze verdeling gevisualiseerd

Een uitgebreidere vorm van de vijf-getallensamenvatting somt ook nog de interkwartielafstand en de eventuele uitschieters op.

Voorbeeld[bewerken]

In 1998 werden veel nieuwe computers gekocht. Een grote firma met vestigingen door heel Nederland registreerde gedurende 41 weken het aantal verkochte computersystemen. De aantallen staan hieronder, geordend naar grootte.

 902 1015 1087 1098 1103 1121 1132 1135 1137 1143 
1154 1166 1185 1199 1200 1213 1214 1219 1219 1228 1239 
1244 1247 1258 1269 1270 1279 1293 1294 1295 1307 
1325 1345 1356 1363 1377 1419 1440 1514 1545 1546 

De vijf-getallensamenvatting is:

Q0 = 902
Q1 = (1143+1154)/2 = 1148,5
Q2 = 1239
Q3 = (1307+1325)/2 = 1316
Q4 = 1546

Hieronder staat de bijbehorende boxplot.

  ┌──────────────────────────────────────────────────────────────┐
  │                         ┌────┬────┐                          │
  │          ├──────────────┤    │    ├─────────────┤            │
  │                         └────┴────┘                          │
  │                                                              │  
  │                                                              │
  │  ──┼─────┼─────┼─────┼─────┼─────┼─────┼─────┼─────┼────     │
  │         900         1100        1300        1500             │
  └──────────────────────────────────────────────────────────────┘