Multinomiale verdeling

Uit Wikipedia, de vrije encyclopedie
Ga naar: navigatie, zoeken

In de kansrekening en de statistiek is de multinomiale verdeling een discrete, multivariate kansverdeling die gezien kan worden als de veralgemening van de binomiale verdeling. De binomiale verdeling is de kansverdeling van het aantal successen in n onafhankelijke Bernoulli-experimenten met gelijke succeskans p. Wanneer een experiment met aselecte trekkingen niet slechts twee uitkomsten (bv. succes en mislukking) heeft, maar meer, beschrijft de multinomiale verdeling de kansen op mogelijke aantallen van de verschillende uitkomsten, wanneer zo'n experiment een vast aantal keren herhaald wordt.

Als voorbeeld kan men denken aan het trekken van een kaart uit een goed geschud pak speelkaarten. De getrokken kaart wordt teruggelegd en na goed schudden wordt het experiment herhaald. Als uitkomst noteert men de kleur van de getrokken kaart. Er zijn vier mogelijkheden: schoppen (), harten (), ruiten () en klaveren (). Bij elke trekking is de kans 1/4 op elk van deze kleuren. De kansverdeling van het aantal getrokken kaarten van de vier kleuren bij 10 keer trekken is een multinomiale verdeling. De kans op bijvoorbeeld de gebeurtenis 1, 2, 3 en 4 bepaalt men door te bedenken dat de mogelijkheid dat de kaarten in de aangegeven volgorde getrokken zijn een kans heeft van:

\left(\begin{matrix}\frac 14\end{matrix}\right)^1\left(\begin{matrix}\frac 14\end{matrix}\right)^2\left(\begin{matrix}\frac 14\end{matrix}\right)^3\left(\begin{matrix}\frac 14\end{matrix}\right)^4.

De kaarten kunnen echter ook in een andere volgorde getrokken zijn met dezelfde kans. Het aantal mogelijkheden is:

\begin{matrix}{10! \over 1!2!3!4!}\end{matrix}.

De kans op de genoemde gebeurtenis is dus:

\begin{matrix}{10! \over 1!2!3!4!}\end{matrix}\left(\begin{matrix}\frac 14\end{matrix}\right)^1\left(\begin{matrix}\frac 14\end{matrix}\right)^2\left(\begin{matrix}\frac 14\end{matrix}\right)^3\left(\begin{matrix}\frac 14\end{matrix}\right)^4.

Definitie[bewerken]

Als een experiment k verschillende uitkomsten heeft, met kansen p1, ..., pk op deze uitkomsten (waarbij dus geldt dat p1 + ... + pk = 1) en Xi is het aantal keren dat de uitkomst i verkregen wordt in n onafhankelijke uitvoeringen van het experiment, dan wordt de kansverdeling van de vector (X_1,\dots,X_k) \, gegeven door:


P(X_1=x_1,\dots,X_k=x_k)={n! \over x_1!\cdots x_k!}p_1^{x_1}\cdots p_k^{x_k},

waarin (x_1,\dots,x_k) \, niet-negatieve gehele getallen zijn, met x_1+\dots +x_k=n \,.

Voorbeeld[bewerken]

In een bepaald land heeft 30% van de inwoners bruin haar, 25% blond haar, en 45% een andere haarkleur. De kans dat bij trekking met terugleggen van zes willekeurig gekozen mensen er twee bruin, één blond en dus drie een andere haarkleur hebben wordt als volgt berekend.

De k = 3 verschillende uitkomsten zijn 1: "bruin", 2: "blond", 3: "anders", met bijbehorende kansen 0,3, 0,25, 0,45. De steekproefgrootte n=6.

P(X_1=2,X_2=1,X_3=3)={6! \over 3! 2! 1!}0{,}3^2 0{,}25^1 0{,}45^3 = \frac{720}{6\cdot 2\cdot 1} 0{,}09 \cdot 0{,}25 \cdot 0{,}09 = 0{,}1215

Momenten[bewerken]

Elk van de stochastische variabelen Xi is binomiaal verdeeld, zodat de verwachtingswaarde gelijk is aan:

\operatorname{E}(X_i) = n p_i,

en de variantie gegeven wordt door

\operatorname{var}(X_i)=np_i(1-p_i).

De covariantie tussen Xi en Xj is

\operatorname{cov}(X_i,X_j)=-np_i p_j

als i en j verschillend zijn.

Zie ook[bewerken]

  • De multinomiale verdeling is een uitbreiding van de binomiale verdeling.
  • Elk van de k afzonderlijke componenten heeft als marginale verdeling een binomiale verdeling met parameters n en pi.