Dirichletverdelingen met
K
=
3
{\displaystyle K=3}
en verschillende vectoren van parameters
α
{\displaystyle \alpha }
; met de klok mee:
α
=
(
6
,
2
,
2
)
,
α
=
(
3
,
7
,
5
)
,
α
=
(
6
,
2
,
6
)
{\displaystyle \alpha =(6,2,2),\ \alpha =(3,7,5),\ \alpha =(6,2,6)}
en
α
=
(
2
,
3
,
4
)
{\displaystyle \alpha =(2,3,4)}
.
De dirichletverdelingen , genoemd naar Johann Dirichlet , vormen een familie van continue multivariate kansverdelingen die een generalisatie zijn van de bètaverdeling en de geconjugeerde a-prioriverdelingen van de multinomiale verdeling in de Bayesiaanse statistiek . Een dirichletverdeling is de verdeling van de kansen op een aantal disjuncte gebeurtenissen als deze gebeurtenissen een gegeven aantal keren zijn opgetreden.
De multinomiale verdeling geeft voor
k
{\displaystyle k}
disjuncte gebeurtenissen de kans dat in
n
{\displaystyle n}
experimenten deze gebeurtenissen een gegeven aantal keren
x
1
,
…
,
x
k
{\displaystyle x_{1},\ldots ,x_{k}}
voorkomen, als zij optreden met voorgeschreven kansen
p
1
,
…
,
p
k
{\displaystyle p_{1},\ldots ,p_{k}}
, waarvoor
p
1
+
…
+
p
k
=
1
{\displaystyle p_{1}+\ldots +p_{k}=1}
. De dirichletverdeling geeft, omgekeerd, bij gevonden aantallen
α
1
=
x
1
,
…
,
α
k
=
x
k
{\displaystyle \alpha _{1}=x_{1},\ldots ,\alpha _{k}=x_{k}}
de verdeling van de kansen
p
1
,
…
,
p
k
{\displaystyle p_{1},\ldots ,p_{k}}
.
In bijvoorbeeld 20 worpen met een eerlijke dobbelsteen geeft de multinomiale verdeling onder andere de kans dat de ogenaantallen 1 tot en met 6 respectievelijk 3, 6, 0, 5, 4 en 2 keer voorkomen. De dirichletverdeling van de orde 6 en met de genoemde aantallen als parameters, geeft dan aan hoe "waarschijnlijk" het bijvoorbeeld is dat de dobbelsteen zuiver is; preciezer, wat de kansdichtheid is voor mogelijke waarden van de parameters
p
1
,
…
,
p
6
{\displaystyle p_{1},\ldots ,p_{6}}
.
De kansdichtheid van de dirichletverdeling van de orde
k
≥
2
{\displaystyle k\geq 2}
met parameters
α
1
,
…
,
α
k
>
0
{\displaystyle \alpha _{1},\ldots ,\alpha _{k}>0}
wordt voor
p
1
,
…
,
p
k
≥
0
{\displaystyle p_{1},\ldots ,p_{k}\geq 0}
met
p
1
+
…
+
p
k
=
1
{\displaystyle p_{1}+\ldots +p_{k}=1}
gegeven door:
f
(
p
1
,
…
,
p
k
;
α
1
,
…
,
α
k
)
=
1
B
(
α
1
,
…
,
α
k
)
∏
i
=
1
k
p
i
α
i
−
1
{\displaystyle f(p_{1},\ldots ,p_{k};\alpha _{1},\ldots ,\alpha _{k})={\frac {1}{\mathrm {B} (\alpha _{1},\dots ,\alpha _{k})}}\prod _{i=1}^{k}p_{i}^{\alpha _{i}-1}}
De normeringsconstante is de multinomiale bètafunctie , die uitgedrukt kan worden in gammafuncties :
B
(
α
1
,
…
,
α
k
)
=
∏
i
=
1
k
Γ
(
α
i
)
Γ
(
∑
i
=
1
k
α
i
)
{\displaystyle \mathrm {B} (\alpha _{1},\ldots ,\alpha _{k})={\frac {\prod _{i=1}^{k}\Gamma (\alpha _{i})}{\Gamma {\bigl (}\sum _{i=1}^{k}\alpha _{i}{\bigr )}}}}
Laat
X
=
(
X
1
,
…
,
X
k
)
{\displaystyle X=(X_{1},\ldots ,X_{k})}
een dirichletverdeling van orde
k
{\displaystyle k}
hebben met parameters
α
1
,
…
,
α
k
{\displaystyle \alpha _{1},\ldots ,\alpha _{k}}
. Noem
α
0
=
∑
i
=
1
k
α
i
{\displaystyle \alpha _{0}=\sum _{i=1}^{k}\alpha _{i}}
Dan zijn[1] [2]
E
(
X
i
)
=
α
i
α
0
{\displaystyle \mathrm {E} (X_{i})={\frac {\alpha _{i}}{\alpha _{0}}}}
en
v
a
r
(
X
i
)
=
α
i
(
α
0
−
α
i
)
α
0
2
(
α
0
+
1
=
1
α
0
+
1
α
i
α
0
(
1
−
α
i
α
0
)
{\displaystyle \mathrm {var} (X_{i})={\frac {\alpha _{i}(\alpha _{0}-\alpha _{i})}{\alpha _{0}^{2}(\alpha _{0}+1}}={\frac {1}{\alpha _{0}+1}}{\frac {\alpha _{i}}{\alpha _{0}}}\left(1-{\frac {\alpha _{i}}{\alpha _{0}}}\right)}
Verder is voor
i
≠
j
{\displaystyle i\neq j}
c
o
v
(
X
i
,
X
j
)
=
−
α
i
α
j
α
0
2
(
α
0
+
1
)
=
−
1
α
0
+
1
α
i
α
0
α
j
α
0
{\displaystyle \mathrm {cov} (X_{i},X_{j})={\frac {-\alpha _{i}\alpha _{j}}{\alpha _{0}^{2}(\alpha _{0}+1)}}=-{\frac {1}{\alpha _{0}+1}}{\frac {\alpha _{i}}{\alpha _{0}}}{\frac {\alpha _{j}}{\alpha _{0}}}}
De zo gedefinieerde covariantiematrix is singulier .
Bronnen, noten en/of referenties