Dirichletverdeling

De dirichletverdelingen, genoemd naar Johann Dirichlet, vormen een familie van continue multivariate kansverdelingen die een generalisatie zijn van de bètaverdeling en de geconjugeerde a-prioriverdelingen van de multinomiale verdeling in de Bayesiaanse statistiek. Een dirichletverdeling is de verdeling van de kansen op een aantal disjuncte gebeurtenissen als deze gebeurtenissen een gegeven aantal keren zijn opgetreden.

Illustratie[bewerken | brontekst bewerken]

De multinomiale verdeling geeft voor $k$ disjuncte gebeurtenissen de kans dat in $n$ experimenten deze gebeurtenissen een gegeven aantal keren $x_{1},\ldots ,x_{k}$ voorkomen, als zij optreden met voorgeschreven kansen $p_{1},\ldots ,p_{k}$ , waarvoor $p_{1}+\ldots +p_{k}=1$ . De dirichletverdeling geeft, omgekeerd, bij gevonden aantallen $\alpha _{1}=x_{1},\ldots ,\alpha _{k}=x_{k}$ de verdeling van de kansen $p_{1},\ldots ,p_{k}$ .

In bijvoorbeeld 20 worpen met een eerlijke dobbelsteen geeft de multinomiale verdeling onder andere de kans dat de ogenaantallen 1 tot en met 6 respectievelijk 3, 6, 0, 5, 4 en 2 keer voorkomen. De dirichletverdeling van de orde 6 en met de genoemde aantallen als parameters, geeft dan aan hoe "waarschijnlijk" het bijvoorbeeld is dat de dobbelsteen zuiver is; preciezer, wat de kansdichtheid is voor mogelijke waarden van de parameters $p_{1},\ldots ,p_{6}$ .

Kansdichtheid[bewerken | brontekst bewerken]

De kansdichtheid van de dirichletverdeling van de orde $k\geq 2$ met parameters $\alpha _{1},\ldots ,\alpha _{k}>0$ wordt voor $p_{1},\ldots ,p_{k}\geq 0$ met $p_{1}+\ldots +p_{k}=1$ gegeven door:

f(p_{1},\ldots ,p_{k};\alpha _{1},\ldots ,\alpha _{k})={\frac {1}{\mathrm {B} (\alpha _{1},\dots ,\alpha _{k})}}\prod _{i=1}^{k}p_{i}^{\alpha _{i}-1}

De normeringsconstante is de multinomiale bètafunctie, die uitgedrukt kan worden in gammafuncties:

\mathrm {B} (\alpha _{1},\ldots ,\alpha _{k})={\frac {\prod _{i=1}^{k}\Gamma (\alpha _{i})}{\Gamma {\bigl (}\sum _{i=1}^{k}\alpha _{i}{\bigr )}}}

Momenten[bewerken | brontekst bewerken]

Laat $X=(X_{1},\ldots ,X_{k})$ een dirichletverdeling van orde $k$ hebben met parameters $\alpha _{1},\ldots ,\alpha _{k}$ . Noem

\alpha _{0}=\sum _{i=1}^{k}\alpha _{i}

Dan zijn^[1]^[2]

\mathrm {E} (X_{i})={\frac {\alpha _{i}}{\alpha _{0}}}

en

\mathrm {var} (X_{i})={\frac {\alpha _{i}(\alpha _{0}-\alpha _{i})}{\alpha _{0}^{2}(\alpha _{0}+1}}={\frac {1}{\alpha _{0}+1}}{\frac {\alpha _{i}}{\alpha _{0}}}\left(1-{\frac {\alpha _{i}}{\alpha _{0}}}\right)

Verder is voor $i\neq j$

\mathrm {cov} (X_{i},X_{j})={\frac {-\alpha _{i}\alpha _{j}}{\alpha _{0}^{2}(\alpha _{0}+1)}}=-{\frac {1}{\alpha _{0}+1}}{\frac {\alpha _{i}}{\alpha _{0}}}{\frac {\alpha _{j}}{\alpha _{0}}}

De zo gedefinieerde covariantiematrix is singulier.

Externe links[bewerken | brontekst bewerken]

Bronnen, noten en/of referenties

↑ Eq. (49.9) on page 488 of Kotz, Balakrishnan & Johnson (2000). Continuous Multivariate Distributions. Volume 1: Models and Applications. New York: Wiley.
↑ BalakrishV. B. (2005), A Primer on Statistical Distributions. John Wiley & Sons, Inc., Hoboken, NJ, ""Chapter 27. Dirichlet Distribution"", p. 274. ISBN 978-0-471-42798-8.

[1] Eq. (49.9) on page 488 of Kotz, Balakrishnan & Johnson (2000). Continuous Multivariate Distributions. Volume 1: Models and Applications. New York: Wiley.

[2] BalakrishV. B. (2005), A Primer on Statistical Distributions. John Wiley & Sons, Inc., Hoboken, NJ, ""Chapter 27. Dirichlet Distribution"", p. 274. ISBN 978-0-471-42798-8.

[1]

[2]

Discrete verdelingen:	Bernoulli · binomiaal · geometrisch · hypergeometrisch · negatief-binomiaal · Poisson · uniform · zèta
Continue verdelingen:	bèta · Cauchy · chi-kwadraat · Erlang · exponentieel · F-verdeling · gamma · Gumbel · hyperexponentieel · logistisch · lognormaal · normaal · Pareto · Rayleigh · student (t-) · uniform · Weibull
Meerdimensionale verdelingen:	multinomiaal · multivariaat normaal