Cramérs V

Uit Wikipedia, de vrije encyclopedie
Ga naar: navigatie, zoeken

Cramérs V is een door de Zweedse wiskundige en statisticus Harald Cramér ontwikkelde associatiemaat voor twee categorische variabelen, dus variabelen die slechts op nominale schaal gemeten zijn.

Populatie[bewerken]

De simultane verdeling van de beide variabelen A en B wordt gegeven door de kansen

p_{ij}=P(A=A_i,B=B_j),i=1,\ldots,r;j=1,\ldots,k.

De "\chi^2-grootheid" die de simultane kansen vergelijkt met de kansen bij onafhankelijkheid is:

\chi_p^2=\sum_{i,j}\frac{(p_{ij}-p_{i.}p_{.j})^2}{p_{i.}p_{.j}}=\sum_{i,j}\frac{p_{ij}^2}{p_{i.}p_{.j}}-1

Daarin is

p_{i.}=\sum_{j}p_{ij} en analoog p_{.j}=\sum_{i}p_{ij}

Bij statistische onafhankelijkheid tussen beide variabelen geldt:

p_{ij}=p_{i.}p_{.j}\,,

dus:

\chi_p^2=0.

Bij volledige samenhang tussen de beide variabelen zijn er evenveel rijen als kolommen ( r=k) en is (eventueel na herschikking):

p_{ii}=p_{i.}=p_{.i}

en

p_{ij}=0, i\neq j,

zodat:

\chi_p^2=k-1.

Voor de populatie kunnen we Cramérs V definiëren als de parameter:

V_p=\sqrt{\frac{\chi_p^2}{\min(r-1,k-1)}}

Met een waarde minimaal 0 bij onderlinge onafhankelijkheid en maximaal 1 bij volledige samenhang.

Steekproef[bewerken]

In een steekproef is Cramérs V gedefinieerd aan de hand van de kruistabel met r rijen en k kolommen en waargenomen frequenties \left(n_{ij}\right), uitgaande van de \chi^2-grootheid:

\chi^2=\sum_{i,j}\frac{(n_{ij}-\frac{n_{i.}n_{.j}}{n})^2}{\frac{n_{i.}n_{.j}}{n}}=n\sum_{i,j}\frac{(\frac{n_{ij}}n-\frac{n_{i.}n_{.j}}{n^2})^2}{\frac{n_{i.}n_{.j}}{n^2}}

Hierin zijn nog \left(n_{i.}\right) en \left(n_{.j}\right) respectievelijk de rij- en kolomsommen en n de steekproefomvang, dus ook de totale som.

Dan is:

V=\sqrt{\frac{\chi^2/n}{\min(r-1,k-1)}}

Zie ook[bewerken]