Betrouwbaarheidsinterval

Uit Wikipedia, de vrije encyclopedie
Naar navigatie springen Naar zoeken springen

Een betrouwbaarheidsinterval is in de statistiek een intervalschatting voor een parameter. In tegenstelling tot een puntschatting geeft een betrouwbaarheidsinterval een heel interval van betrouwbare waarden (schattingen) van de parameter. Een betrouwbaarheidsinterval is een realisatie van een stochastisch interval, dat overigens zelf ook met betrouwbaarheidsinterval wordt aangeduid. De ondergrens en de bovengrens van het stochastische interval zijn stochastische variabelen, die dus bij elke herhaling van het experiment een (mogelijk) andere waarde aannemen. De te schatten parameter daarentegen heeft een, weliswaar onbekende, maar vaste waarde. Van alle realisaties van het interval zullen sommige de parameter wel bevatten, maar sommige ook niet. Hoe groter de betrouwbaarheid, hoe "vaker" het interval de parameter bevat. De kans dat het stochastische interval de parameter bevat heet de betrouwbaarheid van het interval. De onder- en de bovengrens worden berekend uit de steekproefgegevens, en wel zo dat we een sterk vermoeden hebben dat de echte waarde van de populatieparameter zich ertussen bevindt.

Wat een betrouwbaarheidsinterval is, wordt vaak verkeerd begrepen ten gevolge van een subtiliteit. De te schatten parameter heeft een, weliswaar onbekende, maar vaste waarde. Van alle berekende realisaties van het interval zullen sommige de parameter wel bevatten, maar sommige ook niet. Hoe groter de betrouwbaarheid, hoe meer van de berekende intervallen de parameter zullen bevatten. De betrouwbaarheid van het interval geeft aan welk percentage dat is.

Als op grond van een steekproef een 95%-betrouwbaarheidsinterval voor een populatiegemiddelde berekend is, kan men niet zeggen dat er 95% kans is dat in dat interval ligt. Immers: ligt er wel in of ligt er niet in, een van beide. De betekenis is dat bij herhaling van de procedure, met steeds nieuwe (aselecte) steekproeven uit dezelfde populatie, mag worden verwacht dat 95% van de zo berekende intervallen de parameter bevatten.

Definitie[bewerken]

De stochastische variabelen vormen een steekproef uit een verdeling met onbekende parameter . Als voor de steekproeffuncties en geldt:

,

heet het (stochastische) interval een betrouwbaarheidsinterval voor met betrouwbaarheid of een -betrouwbaarheidsinterval. Hierin is zelf geen stochastische variabele van de individuele trekkingen. Voor de realisaties en van respectievelijk en geldt dezelfde kansuitspraak als voor uiteraard niet. Men zegt:

"met betrouwbaarheid geldt: ".

Wanneer de grenzen van het betrouwbaarheidsinterval uit de steekproef kunnen worden berekend, zijn het dus steekproeffuncties en daarom zelf ook stochastische variabelen.

Voorbeeld verkiezingen[bewerken]

Om een beeld te krijgen van de opkomst bij de naderende verkiezingen, is een enquête onder 1000 aselect gekozen stemgerechtigden gehouden. Van deze steekproef zeiden 700 ondervraagden te zullen gaan stemmen. Het opkomstpercentage is natuurlijk een nog onbekende parameter . Een voor de hand liggende (punt)schatting van is: 0,70. Maar het kan ook wat meer of minder zijn. Mogelijk 0,75 of 0,60. Is het aannemelijk dat het 0,50 zou zijn? Om deze vraag te beantwoorden zoekt men een interval , waarvan met een zekere mate van betrouwbaarheid gezegd kan worden dat daarin zal liggen. Met 100%-betrouwbaarheid kan men zeggen dat tussen 0 en 1 zal liggen, maar dat geeft geen informatie. Maar wat is de betrouwbaarheid van het interval [0,65; 0,75]? En hoe moeten de grenzen worden gekozen, als een betrouwbaarheid van 95% gewenst is?

We noemen het aantal stemgerechtigden die zeggen te gaan stemmen. is een stochastische variabele met een binomiale verdeling met parameters en kans dat iemand gaat stemmen. Voor de steekproeffuncties:

en

,

waarin de steekproeffractie is, geldt:

Het interval is dus een 0,95-betrouwbaarheidsinterval voor . Omdat we voor de waarde 700 gevonden hebben, kunnen we de realisaties en van respectievelijk en berekenen.

en

We zeggen daarom dat met betrouwbaarheid 0,95 geldt dat .

Voorbeeld margarine vullen[bewerken]

Een machine vult kuipjes margarine en is zo ingesteld dat in elk kuipje 250 gram margarine moet komen. Natuurlijk is het niet mogelijk om ieder kuipje met precies 250 gram te vullen. Het vulgewicht is een stochastische variabele , waarvan wordt aangenomen dat die een normale verdeling heeft met verwachting en, voor de eenvoud, bekende standaardafwijking gram. Om de afstelling van de machine te controleren nemen we een steekproef van aselect gekozen kuipjes en wegen die. De gewichten aan margarine zijn , een aselecte steekproef van .

Om alleen maar een indruk te krijgen van de verwachting , is het voldoende een schatting te geven. Het steekproefgemiddelde

is daarvoor geschikt. We zoeken een betrouwbaarheidsinterval voor de parameter . Hoe bepalen we zo'n interval?

De gewichten, die in de steekproef zijn gemeten, zijn , en hebben een gemiddelde van:

gram.

We zouden ook 250,4 of 251,1 gram kunnen hebben gevonden. Een waarde van 280 gram is daarentegen weer onwaarschijnlijk. Er is een heel interval rond het waargenomen gemiddelde van 250,2 met schattingen die we ook betrouwbaar vinden, dat wil zeggen waarvan we tamelijk zeker zijn dat de parameter in dat interval ligt. Tamelijk zeker, want absoluut zeker zijn we alleen van het interval (0,∞), maar dat is triviaal.

In ons geval kunnen we de grenzen bepalen door te bedenken dat het steekproefgemiddelde van een normaal verdeelde steekproef, zelf ook normaal verdeeld is, met dezelfde verwachting maar met standaardafwijking gram. Door het gemiddelde te standaardiseren krijgen we:

dat zelf van afhangt, maar standaardnormaal is verdeeld, dus met een verdeling onafhankelijk van de te schatten parameter . We kunnen daarom het getal vinden, onafhankelijk van , zodanig dat met een voorgeschreven kans tussen en ligt. De betrouwbaarheid geeft aan hoe betrouwbaar we het interval vinden. We nemen hier en krijgen:

Het getal volgt uit:

,

dus , en er geldt:

Dit kunnen we zo interpreteren: met kans 0,95 zullen we een interval vinden met stochastische grenzen

en

,

waar tussenin ligt.

Elke keer dat de metingen worden herhaald, zullen we een andere waarde voor het steekproefgemiddelde vinden. In 95% van de gevallen zal tussen de met dit gemiddelde berekende grenzen liggen, in 5% van de gevallen echter ook niet. Het actuele betrouwbaarheidsinterval wordt berekend door de waarden van de gevonden gewichten in te vullen. Zo vinden wij het 0,95-betrouwbaarheidsinterval:

In de onderstaande figuur zijn 50 realisaties van een betrouwbaarheidsinterval met betrouwbaarheid 95% voor een onbekende parameter aangegeven.

NYW-confidence-interval.png

De meeste, in doorsnee 95%, van deze intervallen bevatten de parameter. Enkele daarentegen ook niet. In de praktijk hebben we te maken met een van deze intervallen. Welke dat is weten we niet. Toen we de steekproef namen, hadden we een kans van 95% om een interval te vinden waarin zich de parameter bevindt. Daarom zeggen we dat de parameter met betrouwbaarheid 95% in dit interval ligt. Daarmee bedoelen we niets meer dan dat.

De stochastische variabelen en de stochastische variabelen en horen bij verschillende proeven. Het heeft dus geen nut ze met elkaar te vergelijken.

Betrouwbaarheidsintervallen bij verschillende verdelingen[bewerken]

Normale verdeling[bewerken]

Laat een aselecte steekproef uit de normale verdeling zijn, het steekproefgemiddelde en de variantie.

Bij bekende variantie wordt een -betrouwbaarheidsinterval voor gegeven door:

,

met het -fractiel van de standaardnormale verdeling, dus .


Als niet bekend is, wordt deze geschat, en wordt het -betrouwbaarheidsinterval voor :

,

met het -fractiel van de -verdeling.

Een -betrouwbaarheidsinterval voor is:

met en respectievelijk het - en het -fractiel van de -verdeling.

Exponentiële verdeling[bewerken]

Laat een aselecte steekproef zijn uit de exponentiële verdeling met verwachting en het steekproefgemiddelde.

Een -betrouwbaarheidsinterval voor wordt gegeven door:

,

met en respectievelijk het - en het -fractiel van de -verdeling.

Binomiale verdeling[bewerken]

Laat binomiaal verdeeld zijn met parameters en , en een schatter van .

Voor relatief grote wordt een benaderend -betrouwbaarheidsinterval voor gegeven door:

,

met het -fractiel van de standaardnormale verdeling, dus .

Poissonverdeling[bewerken]

Laat Poisson-verdeeld zijn met verwachtingswaarde . Uit de relatie tussen de verdelingsfuncties van de Poissonverdeling en de chi-kwadraatverdeling kan het volgende -betrouwbaarheidsinterval voor afgeleid worden:

,

met het -fractiel van de -verdeling.

Websites[bewerken]