Hotellings T-kwadraat

Uit Wikipedia, de vrije encyclopedie
Ga naar: navigatie, zoeken

Hotellings T2, kort voor de Hotellings T2-toets, is een statistische toets, genoemd naar Harold Hotelling, die men kan zien als een multivariate generalisatie van de t-toets. Met Hotellings T2 wordt eigenlijk de toetsingsgrootheid bedoeld, gedefinieerd door:

T^2=n(\overline{X}-\mu_0)'S^{-1}(\overline{X}-\mu_0),

gebaseerd op een (aselecte) steekproef X_1,\dots,X_n uit een p-dimensionale verdeling. In de formule stelt op de gebruikelijke manier  \overline{X} het steekproefgemiddelde voor en

 S=\frac 1{n-1}\sum_{i=1}^n (X_i-\overline{X})(X_i-\overline{X})'

de p×p-steekproefcovariantiematrix.

Als de p-dimensionale verdeling een normale verdeling is met vector van verwachtingswaarden \mu_0\,, geldt dat:

\frac{n-p}{p(n-1)}T^2

een F(p,n-p)-verdeling heeft, dus een F-verdeling met p vrijheidsgraden in de teller en n-p in de noemer.


Hotellings T2 wordt vaak gebruikt om uitbijters in multivariate data te detecteren. De Hotelling T2-toets is een multivariate t-toets die gebruikmaakt van de covariantiematrix S van de data:

S = \frac{1}{n-1}\sum_{i=1}^{k}\sum_{j=1}^{n_i}(X_{ij}-\overline{X})(X_{ij}-\overline{X})'

Daarin is

n het totaal aantal stalen
ni het aantal stalen van de genomen subgroep i
k het aantal gemeten variabelen per staal
Xij de vector met het jde staal uit de ide groep
\overline{X} de vector met de gemiddelde meetwaarden over alle stalen en subgroepen

De waarden van Hotelling T2 worden berekend afhankelijk van het feit of er subgroepen zijn en of het populatiegemiddelde bekend is. Men moet subgroepen definiëren, wanneer men merkt dat de meetgegevens in groepen voorkomen. Bijvoorbeeld, wanneer een industriële productie niet volcontinu, maar per ketel, per ton, per vrachtwagen binnengekomen grondstof, ... (men zegt dan ook per batch) gebeurt, dan vormt elke geproduceerde batch een afzonderlijke eenheid of subgroep in de meetgegevens. Van elke zo geproduceerde eenheid of subgroep neemt men dan 1 of meerdere stalen waarvan meetgegevens verzamelt worden.

De waarden van Hotelling T2 worden berekend volgens de vierde kolom van onderstaande tabel. Deze waarden volgen een F-verdeling, waarvan het aantal vrijheidsgraden wordt weergegeven tussen haakjes in de formules uit de vijfde kolom. De grenswaarde waarmee vergeleken wordt, is het p-de percentiel (de waarde van de verdeling waarvoor p% van de stalen een hogere waarde heeft) van deze verdeling. In de Hotelling T2-verdeling wordt verondersteld dat de populaties komen uit multivariate normaal verdeelde populaties. Zijn de varianties van de subgroepen niet gelijk, dan gebruikt men een gewogen covariantiematrix SW:

S_W = \frac{1}{n-k}\sum_{i=1}^{k}(n_i - 1)S_i
Met:
Si: de covariantiematrix voor de groep i
Grootte subgroep (m) Populatie-gemiddelde μT Covariantie T2-statistiek kritieke waarde voor T2
1 Bekend S (X - \mu _T)' S^{-1} (X - \mu _T) \frac{p (n-1)}{n-p} F_{(p, n-p)}
Sw (X - \mu _T)' S_w^{-1} (X - \mu _T) \frac{p (n-k)}{n-k-p+1} F_{(p, n-k-p+1)}
Onbekend S (X - \overline{X})' S^{-1} (X - \overline{X}) \frac{p (n+1)(n-1)}{n(n-p)} F_{(p, n-p)}
Sw (X - \overline{X})' S_w^{-1} (X - \overline{X}) \frac{p (n-k)(n+1)}{n(n-k-p+1)} F_{(p, n-k-p+1)}
> 1 Bekend S (\overline{X}_s - \mu _T)' S^{-1} (\overline{X}_s - \mu _T) \frac{p (n-1)}{m(n-p)} F_{(p, n-p)}
Sw (\overline{X}_s - \mu _T)' S_w^{-1} (\overline{X}_s - \mu _T) \frac{p (n-k)}{m(n-k-p+1)} F_{(p, n-k-p+1)}
Onbekend S (\overline{X}_s - \overline{X})' S^{-1} (\overline{X}_s - \overline{X}) \frac{p (m+n)(n-1)}{mn(n-p)} F_{(p, n-p)}
Sw (\overline{X}_s - \overline{X})' S_w^{-1} (\overline{X}_s - \overline{X}) \frac{p (m+n)(n-k)}{mn(n-k-p+1)} F_{(p, n-k-p+1)}

Hierbij is:

μT het gemiddelde van de totale populatie
\overline{X}_s: het gemiddelde voor de groep stalen die men met de populatie vergelijkt

Verder hebben alle andere parameters in deze tabel dezelfde betekenis als vermeld bij de andere vergelijkingen.

Literatuur[bewerken]

  • Mason, R.L.; Chou, Y.-M.; Young, J.C. Journal of Quality Technology, 2001, 33, 466-478

Zie ook[bewerken]