Vijf-getallensamenvatting

Uit Wikipedia, de vrije encyclopedie

De vijf-getallensamenvatting is in de beschrijvende statistiek de opsomming van de kwartielen van een dataset. Daarbij worden minimum en maximum, aangeduid met en ook tot de kwartielen gerekend. De kwartielen verdelen de data in vier delen, van elk een kwart van de data. Uit de ligging van de kwartielen krijgen we een indruk van de vorm van de verdeling van de data. Door de grafische weergave van de vijf-getallensamenvatting in een boxplot wordt de indruk van deze verdeling gevisualiseerd

Een uitgebreidere vorm van de vijf-getallensamenvatting somt ook nog de interkwartielafstand en de eventuele uitschieters op.

Voorbeeld[bewerken | brontekst bewerken]

In 1998 werden veel nieuwe computers gekocht. Een grote firma met vestigingen door heel Nederland registreerde gedurende 41 weken het aantal verkochte computersystemen. De aantallen staan hieronder, geordend naar grootte.

 902 1015 1087 1098 1103 1121 1132 1135 1137 1143 
1154 1166 1185 1199 1200 1213 1214 1219 1219 1228 1239 
1244 1247 1258 1269 1270 1279 1293 1294 1295 1307 
1325 1345 1356 1363 1377 1419 1440 1514 1545 1546 

De vijf-getallensamenvatting is:

Q0 = 902
Q1 = (1143+1154)/2 = 1148,5
Q2 = 1239
Q3 = (1307+1325)/2 = 1316
Q4 = 1546

Hieronder staat de bijbehorende boxplot.

  ┌──────────────────────────────────────────────────────────────┐
  │                         ┌────┬────┐                          │
  │          ├──────────────┤    │    ├─────────────┤            │
  │                         └────┴────┘                          │
  │                                                              │  
  │                                                              │
  │  ──┼─────┼─────┼─────┼─────┼─────┼─────┼─────┼─────┼────     │
  │         900         1100        1300        1500             │
  └──────────────────────────────────────────────────────────────┘