Gemiddelde

Uit Wikipedia, de vrije encyclopedie
Ga naar: navigatie, zoeken

Bij rekenen en in de wiskunde is het gemiddelde of de gemiddelde waarde een begrip dat veelvuldig voorkomt. Het bekendste is het rekenkundig gemiddelde: de som van een aantal getallen gedeeld door het aantal getallen.

Statistiek[bewerken]

In de statistiek wordt het begrip gemiddelde veel gebruikt. We moeten hierbij onderscheiden of het om de gehele populatie gaat of om een steekproef daaruit.

Populatiegemiddelde[bewerken]

In de statistiek wordt het populatiegemiddelde van een kenmerkende grootheid vaak aangeduid met de Griekse letter μ. Voor een eindige populatie is het populatiegemiddelde juist het rekenkundig gemiddelde van alle populatiewaarden.

Bij aselecte trekking van een waarde X van die grootheid uit de populatie, is de kansverdeling van X juist de populatieverdeling, met als gevolg dat de verwachtingswaarde van X juist gelijk is aan het populatiegemiddelde.

Heeft X een discrete verdeling met kansfunctie p(x), dan is de verwachtingswaarde gedefinieerd door:

\mu = \operatorname{E}(X) = \sum_i x_i p(x_i).

Als X een continue verdeling heeft met kansdichtheid f(x), dan is de verwachtingswaarde gedefinieerd door:

\mu = \operatorname{E}(X) = \int x f(x) dx.

Het is echter vaak onmogelijk om het populatiegemiddelde te bepalen. Als we bijvoorbeeld geïnteresseerd zijn in het gemiddelde gewicht van de Sumatraanse neushoorn, zouden we dat kunnen bepalen, omdat er nog maar zo'n 250 van zijn. Bij muskieten ligt dat echter heel anders. Er zijn er gewoon te veel om ze allemaal te kunnen onderzoeken. In zo'n geval nemen statistici meestal hun toevlucht tot een steekproef om door de berekening van het steekproefgemiddelde een schatting te krijgen van het populatiegemiddelde.

Steekproefgemiddelde[bewerken]

Het steekproefgemiddelde is het rekenkundige gemiddelde van de steekproef. Als de steekproefuitkomst bestaat uit de n elementen  x_1,\dots,x_n , dan is het steekproefgemiddelde het getal:

\bar{x}=\frac{1}{n}\sum_{i=1}^n x_i.

In de theorie is men niet zozeer geïnteresseerd in de uitkomsten, maar in het stochastisch gedrag van de steekproef. De steekproef bestaat uit de n stochastische variabelen X_1,\dots,X_n en het steekproefgemiddelde is de variabele:

\bar{X}=\frac{1}{n}\sum_{i=1}^n X_i.

Het steekproefgemiddelde \bar{x} wordt vaak gebruikt om iets te zeggen over het populatiegemiddelde μ. Het wordt dan opgevat als een realisatie van het steekproefgemiddelde \bar{X}. Daar zitten echter een paar haken en ogen aan. Als de steekproef aselect was, is het steekproefgemiddelde een goede benadering, of schatting, van het populatiegemiddelde. Hoe goed deze benadering is, hangt nog van vele factoren af, zoals van de steekproefomvang en de onderliggende verdeling. Wanneer het aantal proeven voldoende is, is daarmee voor de steekproef een wet van de grote aantallen bepaald. Er zijn verdelingen die geen populatiegemiddelde bezitten, omdat de bovenstaande integraal niet bestaat.

Gelukkig kunnen we vaak veronderstellen dat de onderliggende verdeling normaal is. Dan speelt naast de verwachtingswaarde alleen de standaardafwijking een rol, waarvan we de waarde ook uit de steekproef kunnen schatten.

Soorten gemiddelde[bewerken]