Chi-kwadraatverdeling

Uit Wikipedia, de vrije encyclopedie
Ga naar: navigatie, zoeken
chi-kwadraatverdeling
Kansdichtheid
Kansverdeling voor verschillende k's
Verdelingsfunctie
Chi-square distributionCDF.png
Parameters k > 0\, vrijheidsgraden
Drager x \in [0; +\infty)\,
Kansdichtheid \frac{(1/2)^{k/2}}{\Gamma(k/2)} x^{k/2 - 1} e^{-x/2}\,
Verdelingsfunctie \frac{\gamma(k/2,x/2)}{\Gamma(k/2)}\,
Verwachtingswaarde k\,
Mediaan bij benadering k-2/3\,
Modus k-2\, als k\geq 2\,
Variantie 2\,k\,
Scheefheid \sqrt{8/k}\,
Kurtosis 12/k\,
Entropie \frac{k}{2}\!+\!\ln(2\Gamma(k/2))\!+\!(1\!-\!k/2)\psi(k/2)
Moment-
genererende functie
(1-2\,t)^{-k/2} voor 2\,t<1\,
Karakteristieke functie (1-2\,i\,t)^{-k/2}\,
Portaal  Portaalicoon   Wiskunde

De chi-kwadraatverdeling of χ2-verdeling is afgeleid van de normale verdeling en verbonden met de verdeling van de steekproefvariantie van een aselecte steekproef uit een normale verdeling. Het is de verdeling van de som van de kwadraten van n onderling onafhankelijke standaard-normaal verdeelde variabelen Z_1, \dots , Z_n, dus van:

\chi_n^2=Z_1^2+ \dots + Z_n^2.

De parameter n wordt het aantal vrijheidsgraden genoemd. De chi-kwadraatverdeling is een specifiek geval van de gamma-verdeling.

Kansdichtheid[bewerken]

Voor n vrijheidsgraden wordt de kansdichtheid f_n voor x>0 gegeven door

f_n(x) = \frac{1}{2^{\frac{n}{2}}\Gamma(\frac{n}{2})} x^{\frac{n}{2}-1}e^{-\frac{x}{2}} .

De verwachtingswaarde is n en de variantie 2n.

Toepassing[bewerken]

Voor de (gebruikelijke) steekproefvariantie

S^2=\frac{1}{n-1}\sum_{i=1}^n(X_i-\bar X)^2

van een aselecte steekproef van omvang n uit een N(μ,σ2)-verdeling geldt:

(n-1)\frac{S^2}{\sigma^2} is verdeeld als \chi_{n-1}^2.

Dit is geen bijzonderheid, want de chi-kwadraatverdeling is juist ontwikkeld als de verdeling van deze grootheid. We kunnen dit enigszins plausibel maken door te schrijven:

(n-1)\frac{S^2}{\sigma^2}
=\frac 1{\sigma^2}\sum_{i=1}^n(X_i-\bar X)^2
=\sum_{i=1}^n\left(\frac{X_i-\mu}{\sigma}\right)^2-\left(\frac{\bar X-\mu}{\sigma/\sqrt n}\right)^2=\sum_{i=1}^n Z_i^2-Z_0^2,

waarin alle Z's standaardnormaal verdeeld zijn.

Afleiding van de dichtheid[bewerken]

De dichtheid van de toevalsvariabele \chi^2_n=X_1^2+\dotsb + X_n^2, waarin X_1,\dots ,X_n onderling onafhankelijk en standaardnormaal verdeeld zijn, volgt uit de simultane dichtheid van X_1,\dots ,X_n. Deze simultane dichtheid is het n-voudige product van de standaardnormale dichtheid :

f_{X_1,\dots ,X_n}(x_1,\dots ,x_n)=\prod_{i=1}^n \frac{e^{-\frac12 x_i^2}}{\sqrt{2\pi}}=(2\pi)^{-\frac n2} e^{-\frac 12 (x_1^2+ \dotsb +x_n^2)}.

Voor de gezochte dichtheid geldt:


\begin{align}
f_{\chi^2_n}(z) & =\lim_{h\to 0} \tfrac 1h P(z< \chi^2_n \le z+h) \\
& =\lim_{h\to 0} \tfrac 1h \int\limits_K (2\pi)^{-\frac n2} e^{-\frac 12 (x_1^2+ \dotsb +x_n^2)}\,dx_1 \ldots dx_n \\
& =(2\pi)^{-\tfrac n2} e^{-\frac z2} \lim_{h\to 0} \tfrac 1h \int\limits_K dx_1\ldots dx_n \\
\end{align}

met K=\{z\leq x_1^2+ \dotsb +x_n^2\leq z+h\}.

In de limiet is die som in de e-macht gelijk aan z, en daarom kan de e-macht buiten de integraal en voor de limiet gehaald worden..

De resterende integraal

\int\limits_K dx_1\ldots dx_n = V_n(\sqrt{z+h})-V_n(\sqrt z),

is het volume van de bolschil tussen de bol met straal \sqrt{z+h} en de bol met straal \sqrt z.

V_n(R)= \frac{\pi^{\frac n2}R^n}{\Gamma(\frac n2+1)}

stelt het volume voor van de n-dimensionale bol met straal R.

Dus is:


\lim_{h\to 0} \frac 1h \int\limits_K dx_1\ldots dx_n = \frac{dV_n(\sqrt{z})}{dz} =\frac{\pi^{\tfrac n2}z^{\tfrac n2-1}}{\Gamma(\tfrac n2)}

en na invullen in de uitdrukking voor de gezochte dichtheid vinden we:


f_{\chi^2_n}(z)= \frac{z^{\frac n2-1}e^{-\frac z2}}{2^{\frac n2}\Gamma(\frac n2)}
.