Cramérs V

Uit Wikipedia, de vrije encyclopedie
Ga naar: navigatie, zoeken

Cramérs V is een door de Zweedse wiskundige en statisticus Harald Cramér ontwikkelde associatiemaat voor twee categorische variabelen, dus variabelen die slechts op nominale schaal gemeten zijn.

Populatie[bewerken]

De simultane verdeling van de beide variabelen wordt gegeven door de simultane kansen \left(p_{ij}\right). De χ2-grootheid die de simultane kansen vergelijkt met de kansen bij onafhankelijkheid is:

\chi_p^2=\sum_{i,j}\frac{(p_{ij}-p_{i.}p_{.j})^2}{p_{i.}p_{.j}}=\sum_{i,j}\frac{p_{ij}^2}{p_{i.}p_{.j}}-1

Bij statistische onafhankelijkheid tussen beide variabelen geldt:

p_{ij}=p_{i.}p_{.j}\,,

dus:

\chi_p^2=0.

Bij volledige samenhang tussen de beide variabelen zijn er evenveel rijen als kolommen, zeg k en is (eventueel na herschikking):

p_{ii}=p_{i.}=p_{.i}\,, en anders 0.

zodat:

\chi_p^2=k-1,

Voor de populatie kunnen we Cramérs V definiëren als de parameter:

V_p=\sqrt{\frac{\chi_p^2}{\min(r-1,k-1)}}

Met een waarde minimaal 0 bij onderlinge onafhankelijkheid en maximaal 1 bij volledige samenhang.

Steekproef[bewerken]

In een steekproef is Cramérs V gedefinieerd aan de hand van de kruistabel met r rijen en k kolommen en waargenomen frequenties \left(n_{ij}\right), uitgaande van de χ2-grootheid:

\chi^2=\sum_{i,j}\frac{(n_{ij}-\frac{n_{i.}n_{.j}}{n})^2}{\frac{n_{i.}n_{.j}}{n}}

Hierin zijn nog \left(n_{i.}\right) en \left(n_{.j}\right) respectievelijk de rij- en kolomsommen en n de steekproefomvang, dus ook de totale som.

Dan is:

V=\sqrt{\frac{\chi^2}{n\min(r-1,k-1)}}

Zie ook[bewerken]