Multinomiale verdeling

Uit Wikipedia, de vrije encyclopedie
Ga naar: navigatie, zoeken

In de kansrekening en de statistiek is de multinomiale verdeling een discrete, multivariate kansverdeling die gezien kan worden als de veralgemening van de binomiale verdeling. De binomiale verdeling is de kansverdeling van het aantal successen in n onafhankelijke Bernoulli-experimenten met gelijke succeskans p. Wanneer een experiment met aselecte trekkingen niet slechts twee uitkomsten (bv. succes en mislukking) heeft, maar meer, beschrijft de multinomiale verdeling de kansen op mogelijke aantallen van de verschillende uitkomsten, wanneer zo'n experiment een vast aantal keren herhaald wordt.

Als voorbeeld kan men denken aan het trekken van een kaart uit een goed geschud pak speelkaarten. De getrokken kaart wordt teruggelegd en na goed schudden wordt het experiment herhaald. Als uitkomst noteert men de kleur van de getrokken kaart. Er zijn vier mogelijkheden: schoppen (), harten (), ruiten () en klaveren (). Bij elke trekking is de kans 1/4 op elk van deze kleuren. De kansverdeling van het aantal getrokken kaarten van de vier kleuren bij 10 keer trekken is een multinomiale verdeling. De kans op bijvoorbeeld de gebeurtenis 1, 2, 3 en 4 bepaalt men door te bedenken dat de mogelijkheid dat de kaarten in de aangegeven volgorde getrokken zijn een kans heeft van:

De kaarten kunnen echter ook in een andere volgorde getrokken zijn met dezelfde kans. Het aantal mogelijkheden is:

.

De kans op de genoemde gebeurtenis is dus:

Definitie[bewerken]

Als een experiment k verschillende uitkomsten heeft, met respectievelijke kansen p1, ..., pk op deze uitkomsten (waarbij dus geldt dat p1 + ... + pk = 1) en Xi is het aantal keren dat de uitkomst i verkregen wordt in n onafhankelijke uitvoeringen van het experiment, dan wordt de kansverdeling van de vector gegeven door:

waarin niet-negatieve gehele getallen zijn, met .

Deze verdeling heet de multinomiale verdeling met parameters n en p1, ..., pk.

Voorbeeld[bewerken]

In een bepaald land heeft 30% van de inwoners bruin haar, 25% blond haar, en 45% een andere haarkleur. De kans dat bij trekking met terugleggen van zes willekeurig gekozen mensen er twee bruin, één blond en dus drie een andere haarkleur hebben wordt als volgt berekend.

De k = 3 verschillende uitkomsten zijn 1: "bruin", 2: "blond", 3: "anders", met bijbehorende kansen 0,3, 0,25, 0,45. De steekproefgrootte n=6.

Momenten[bewerken]

Elk van de stochastische variabelen Xi is binomiaal verdeeld, zodat de verwachtingswaarde gelijk is aan:

en de variantie gegeven wordt door

De covariantie tussen Xi en Xj is

als i en j verschillend zijn.

Eigenschap[bewerken]

Elk van de k afzonderlijke componenten heeft als marginale verdeling een binomiale verdeling met parameters n en pi.