Overleg:Voorwaardelijke kans

Uit Wikipedia, de vrije encyclopedie
Naar navigatie springen Naar zoeken springen

Ik heb de volgende tekst verwijderd omdat deze gewoon fout is:

Vaak leiden voorwaardelijke kansen tot resultaten die men niet direct voor de hand vindt liggen.
Een vader heeft voor z'n vier kinderen een kaartje gekocht voor een voorstelling van het circus "Sancordino". Omdat een van de kinderen ziek geworden is, gaan er maar drie naar het circus. Dat zijn alle drie meisjes. Wat is de (voorwaardelijke) kans dat het zieke kind een jongen is? Die kans is 4/5, immers:
.
Daarin stelt bijvoorbeeld de reeks "mmjm" de gezinssituatie voor dat de oudste twee kinderen en de jongste meisjes zijn.

Het probleem is dat we niet , maar . Om het berekenen gemakkelijker te maken, schrijven we of voor een gezond en of voor een ziek kind. Dan:

Meer met het verstand geredeneerd: P(3m+j) is 4x zo groot als P(4m), maar is 4x zo groot als - André Engels 3 okt 2006 21:37 (CEST)[reageer]

Dan ziet het er zo uit:

.

want de teller heeft kans 4/16 en voor de noemer geldt:

.

De laatste vorm bestaat uit disjuncte mogelijkheden, en heeft dus kans 5/16. (bijdrage van Madyno 6 feb 2009 21:56)

Niet helemaal eerlijk, want het waarnemingsgegeven is niet zomaar dat er minstens drie meisjes zijn, maar wel dat de drie kinderen die kunnen komen, alledrie meisjes zijn. Dat is strikt meer informatie: je kunt de kinderen namelijk nummeren.
Noteer k1, k2, k3 voor de geslachten van de kinderen die komen opdagen, en k4 voor het geslacht van de afwezige. A priori (zonder dat we één kind hebben gezien) is
en zijn de vier geslachten onafhankelijk. De "voorwaardelijke kans" uit het vraagstuk is
De kans is wél 4/5 in een lichtjes gewijzigd experiment, waarbij de vader een op het laatste moment een kaartje verliest en in principe meisjes voorrang geeft op jongens.--Lieven Smits 7 feb 2009 00:24 (CET)[reageer]

Ok! De bedoeling is van een gezin met 4 kinderen, de kans te berekenen dat het 4e kind een jongen is als je weet dat er 3 meisjes zijn. Het verhaaltje is bedoeld om het wat verrassender te maken, maar door het onderscheid ziek/gezond gaat het mis.Madyno 7 feb 2009 01:23 (CET)[reageer]

Dat klopt: van alle gezinnen met vier kinderen waarvan minstens drie meisjes, hebben ongeveer 80% precies drie meisjes. Veel duidelijker zo.--Lieven Smits 8 feb 2009 00:02 (CET)[reageer]

Bayes[brontekst bewerken]

Ik had de formule die als theorema van Bayes geepresenteerd wordt, verwijderd. Limowreck heeft deze weer teruggeplaatst. De genoemde formule is eigenlijk niet wat men verwacht als formule van Bayes. De juiste formule en verklaring staan in het betrokken lemma. Vandaar.Madyno 4 okt 2006 14:04 (CEST)[reageer]

Hoezo, dit is netjes de simpele vorm van en:Bayes' theorem (uitgebreider artikel in het engels blijkbaar). Aangezien het een klein formuletje is, is het informatief en visueel duidelijk dit gewoon ook in het artikel te zetten ;-) (ik doe het vaak zo: beeld je in dat iemand bv. enkel een afprint van dit artikel heeft en je een +/- duidelijke lapje tekst wil schrijven). Uiteraard, meer info rond Bayes hoort hier niet, daarvoor link je inderdaad gewoon naar het ander artikel. --LimoWreck 4 okt 2006 18:54 (CEST)[reageer]
Ik heb de bewoording nu aangepast zodat hetzelfde vermeld wordt zonder te beweren dat dit het theorema zelf is. - André Engels 4 okt 2006 20:42 (CEST)[reageer]

Noodzakelijkheid van de voorwaardelijke kansrekening[brontekst bewerken]

In het artikel lees ik twee mogelijke voorwaarden:

1. Gebeurtenis A heeft plaatsgevonden waardoor uitkomst B beperkt is tot A.
2. Gebeurtenis A verandert de kansen van uitkomst B.

Verduidelijking aan de hand van de voorbeelden in het artikel, met de volgende aannames:

1. P(B=vrouw)=0,5. A = een bepaalde provincie. A is bekend, en we weten nu dat uitkomst B beperkt is tot A, maar dit verandert P(B) nooit.
2. P(B=zachteG)=0,5. A = een bepaalde provincie. A is bekend, en we weten nu dat uitkomst B beperkt is tot A, en mogelijk verandert dat P(B).

In het tweede voorbeeld is een voorwaardelijke kansrekening P(B|A) vereist, omdat de situatie dusdanig is veranderd dat de 'onvoorwaardelijke' kans van 0,5 mogelijk niet meer geldt. In het eerste voorbeeld echter is kans P(B) per definitie gelijk aan kans P(B|A).

Gesteld dat gevraagd wordt naar P(B), dan is een voorwaardelijke kansrekening mijns inziens alleen noodzakelijk als P(B) kan veranderen door een gebeurtenis A. Dit begrijp ik eigenlijk ook uit het artikel, maar het wordt niet expliciet vermeld. In dat geval bestaat de mogelijkheid om naast of in plaats van een voorwaardelijke kansrekening een onvoorwaardelijke toe te passen. Is dat een relevante toevoeging? Heptalogos 6 feb 2009 21:06 (CET)[reageer]

Nee, immers de onvoorwaardelijke kans op A is P(A) en de voorwaardelijke gegeven B is P(A|B) de "kansen" P(.) en P(.|B) zijn principieel verschillende afbeeldingen.Madyno 6 feb 2009 21:29 (CET)[reageer]
De stelling is dat gevraagd wordt naar P(B). P(A) is principieel niet van belang indien deze geen invloed heeft op P(B). In voorbeeld 1 is dat het geval; de provincie doet er niet toe, maar 'beperkt' feitelijk wel de mogelijkheden. Omdat P(B) gelijk blijft bij welke A dan ook, en P(A) en P(B) elkaar onderling dus niet beïnvloeden, geldt , zodat P(B|A) = P(B). Heptalogos 6 feb 2009 23:44 (CET)[reageer]

Sorry heb algemeen A en B gebruikt, niet in de bovengenoemde specifieke betekenis. In het geval boven gaat het om het verschil tussen P(.) en P(.|A). Ook al is P(vrouw|provincie)=P(vrouw), toch zijn het verschillende begrippen. Als populair gezegd wordt: "de kans op B verandert niet", wordt niet bedoeld: P(B) verandert niet - hoe zou die ook -, maar dat de voorwaardelijke kans gelijk is aan de onvoorwaardelijke! Je constatering dat voor onafhankelijke A en B geldt: P(B|A)=P(AB)/P(A)=P(B) is zeker waar, maar daaruit kun je niet concluderen dat P(.) = P(.|A), want alleen voor gebeurtenissen B die onafhankelijk zijn van A stemmen de kansen overeen. Madyno 7 feb 2009 15:51 (CET)[reageer]

Stel dat 12 provincies gelijkelijk zijn verdeeld over 4 landstreken, te weten Noord, Oost, Zuid en West. We kiezen eerst willekeurig een landstreek, vervolgens willekeurig een provincie in die landstreek, en vervolgens willekeurig een persoon uit die provincie. We willen de kans weten dat een vrouw wordt gekozen. Mannen en vrouwen zijn binnen elke provincie gelijkelijk verdeeld.
We hebben op een gegeven moment de eerste keuze gemaakt: Noord. We willen nog steeds de kans weten dat een vrouw wordt gekozen. Is het nu noodzakelijk om een voorwaardelijke kansrekening toe te passen? Zo ja, waarom? Heptalogos 7 feb 2009 23:24 (CET)[reageer]

Heel eenvoudig, omdat je daarnaar vraagt. Je vraagt immers hoe de verdeling is van de aantallen mannen en vrouwen in de landstreek Noord. In dit geval weet je het antwoord al, maar dat is het punt niet. Dan moet je maar niet naar de bekende weg vragen. Je kunt er beter van uitgaan dat je niet weet of binnen elke provincie mannen en vrouwen gelijkelijk verdeeld zijn. Al is het landelijk wel het geval, per provincie hoeft het niet zo te zijn.Madyno 8 feb 2009 11:26 (CET)[reageer]

Jawel, dat is een gegeven: mannen en vrouwen zijn binnen elke provincie gelijkelijk verdeeld. Ik vraag niet naar de bekende weg maar hooguit naar de bekende bestemming. De te volgen weg is hier juist de kwestie. We weten beiden het antwoord op de vraag, maar ik wil weten middels welke benadering dit antwoord gestaafd dient te worden. Ik vraag je ook niet om advies over waar ik beter vanuit kan gaan. Dit is de gegeven situatie en de vraag is of een voorwaardelijke aanpak noodzakelijk is. Jouw antwoord daarop is ja.
Ik kan hier een logische, 'onvoorwaardelijke' redenatie presenteren, die leidt naar een correct antwoord. De validiteit van de logica van de redenatie evenals de correctheid van het antwoord worden algemeen aanvaard, maar de vorm van de redenatie, dat wil zeggen het procestype of de methode, wordt principieel door jou niet aanvaard. Heb ik het tot dusver correct samengevat? Heptalogos 8 feb 2009 13:52 (CET)[reageer]

Het experiment is hier kennelijk het aanwijzen van een willekeurige persoon uit Nederland en het vaststellen van landstreek, provincie en geslacht. Als je zegt: we hebben een eerste keuze gemaakt: Noord, dan betekent dat, dat je je verder beperkt tot Noord. Dus alles wat volgt (onder deze keuze) is voorwaardelijk gegeven Noord. Wat valt daar verder over te zeggen? De enige mogelijkheid dat onvoorwaardelijk en voorwaardelijk gegeven Noord samenvallen is als er buiten Noord niets anders is in Nederland, dus als door Noord de uitkomsten niet ingeperkt worden. Je tweede alinea is volstrekt onbegrijpelijk.Madyno 8 feb 2009 18:42 (CET)[reageer]

Voorwaardelijk en onvoorwaardelijk vallen niet samen, omdat er meer is buiten Noord. Noord beperkt de uitkomsten. En omdat de uitkomsten beperkt worden door Noord, is er volgens de definitie uit de eerste zin van het artikel sprake van een voorwaardelijke kans. Volgens jou moet daarom die kans berekend worden als voorwaardelijke kans, dus P(B|A). Het betreft (de vraag naar) de kans dat een vrouw wordt gekozen. Het juiste antwoord kan ik onvoorwaardelijk beredeneren, dat is wat ik zeg in mijn tweede alinea. Dat doe ik simpelweg door te stellen dat alle provincies een gelijke verdeling kennen van mannen en vrouwen, en dat de verhouding 1:1 is, en dat daarom de gevraagde kans per definitie 0,5 is, ongeacht tot welke provincie we ons beperken. Dat is mijn onvoorwaardelijke kansbepaling, met een volstrekt heldere logica, die leidt tot het correcte antwoord. Maar volgens jou is dit geen geldige kansrekening, omdat het de kans op Noord niet meeneemt in de kansbepaling. Dat noem ik een principiële afwijzing, omdat het kennelijk iets te maken heeft met afspraken, perspectieven, uitgangspunten etc. Heptalogos 8 feb 2009 22:49 (CET)[reageer]

Weet je wat, laat je berekeningen maar eens zien. Madyno 8 feb 2009 23:08 (CET)[reageer]

1(vrouw)/2(vrouw,man)=0,5 Heptalogos 8 feb 2009 23:39 (CET)[reageer]

Ik zal alleen op serieuze berekeningen reageren.Madyno 9 feb 2009 01:54 (CET)[reageer]

Hoe kan ik een serieuze berekening geven van P(vrouw) als er willekeurig wordt gekozen uit een groep mensen waarin evenveel vrouwen als mannen zitten, anders dan 1/2 = 0,5? Wat wil je zien? P(vrouw) = 1/2 = 0,5? Wat valt hieraan te berekenen? Indien dit niet voldoet aan bepaalde wiskundige conventies, dan met excuses; mijn kennis daarvan is gering. Normaal zou ik het opzoeken maar hier mis ik volledig het idee van wat er mist. Heptalogos 9 feb 2009 21:44 (CET)[reageer]

Geef de aantallen in de verschillende groepen een naam en definieer daarmee de "kansen".Madyno 9 feb 2009 22:57 (CET)[reageer]

Ik kan wel namen en aantallen bedenken, maar dat verandert niets aan mijn berekening. Bijvoorbeeld:
Noord: provincies ABC
Oost: provincies DEF
Zuid: provincies GHI
West: provincies JKL
Elke provincie bevat 1,3 miljoen mensen, waarin mannen en vrouwen steeds gelijkelijk zijn verdeeld.
De procedure is weliswaar om eerst een landstreek te kiezen, vervolgens een provincie, en dan pas een persoon, maar de gevraagde kans is louter de kans om een vrouw te kiezen. In mijn onvoorwaardelijke berekening betrek ik geen tussenstappen, omdat ze geen invloed hebben op de gevraagde kans. Ze kunnen worden beschouwd als een vaste procedure die leidt naar de situatie waarin we uiteindelijk een persoon kiezen uit een populatie van 1,3M mensen. Heptalogos 10 feb 2009 12:28 (CET)[reageer]

Ik zal je helpen, ik zie dat het je niet lukt.

Nland: aantal mensen in hele land
Vland: aantal vrouwen in hele land
NNoord: aantal mensen in Noord
VN: aantal vrouwen in Noord

Bij willekeurig kiezen uit hele land:

P(vrouw) = Vland/Nland

Onder de voorwaarde "Noord"

P(vrouw|Noord) = VNoord/NNoord

Ik hoop dat je ziet dat het verschillende dingen zijn, in jouw geval wel met dezelfde getalswaarde. Madyno 10 feb 2009 13:22 (CET)[reageer]

Ten eerste kúnnen we helemaal geen mensen kiezen in het hele land of de landstreek, maar alleen in de provincie. De reden daarvan doet er niet toe; neem het maar van me aan. Ten tweede zie ik dat je hoe dan ook een voorwaardelijke berekening wilt toepassen, terwijl mijn waarom-vraag onbeantwoord blijft. Ik zie het verschil tussen beide methoden; die discussie zijn we voorbij. Waar ik mee zit is het volgende: we weten dat de uitkomsten zijn beperkt tot Noord, en daarom kunnen we de gevraagde kans (misschien) beschouwen als een voorwaardelijke. Is dat echter noodzakelijk voor toepassing van een correcte kansrekening? Ik stel dat dat beslist niet het geval is. Het is namelijk duidelijk dat de onvoorwaardelijke kans van 0,5 niet verandert door welke gebeurtenis dan ook behalve de uiteindelijke persoonskeuze.
Ik stel dat in elke provincie de sexes gelijkelijk zijn verdeeld en dat daarom P(vrouw)=0,5. Dat is een geldige onvoorwaardelijke bewering. Jij stelt dat de situatie 'Noord' de uitkomsten beperkt en dat dit daarom een ongeldige methode is. Als ik je vraag waarom je dat denkt, laat je alleen zien dat de methoden verschillen. Ik denk dat de misvatting bovendien schuilt in de aanname dat 'beperkte uitkomsten' bepalen dat sprake is van voorwaardelijkheid. Welke bron kan hiervoor worden gebruikt? Het Engelse Wiki-artikel stelt dat voorwaardelijkheid wordt bepaald door de statistische afhankelijkheid van de gebeurtenissen. Zie Onafhankelijkheid (kansrekening). Heptalogos 10 feb 2009 15:11 (CET)[reageer]

Kijk je kunt niet eenvoudig een P schrijven en zomaar over kans spreken. Altijd zul je erbij moeten zeggen welk "kansexperiment" je bedoelt, zeg maar op welke kanssituatie de kans P betrekking heeft. Als ik als totaal experiment in Noord iemand aanwijs en zeg de kans P(V) op een vrouw is 1/2, dan weet ik veder niks over de ander regio's. Ook daar kan ik een experiment doen, mmar dan kan ik niet weer de letter P gebruiken. Madyno 10 feb 2009 23:29 (CET)[reageer]

Ik doe ook maar één experiment, waarin ik op een knop druk die een procedure start. Deze procedure zal uiteindelijk een persoon kiezen en ik wil de kans weten dat dit een vrouw is. De procedure is een programmaatje dat eerst een landstreek kiest, dan een provincie, en dan een persoon, allemaal willekeurig. Alleen heb jij het programmaatje gepauzeerd, gespiekt in de tussentijdse resultaten, om vervolgens mijn kansberekening in twijfel te trekken, als zijnde een juiste berekening van de kans op dat moment. Ik zeg simpelweg: als ik dit programma herhaaldelijk uitvoer is de gemiddelde kans dat de door dit programma gekozen persoon een vrouw is 0,5, en daarbij verklaar ik die bewering geldig op elk willekeurig moment in de uitvoering van de procedure. Ik wacht overigens nog steeds op een bron voor de stelling in de eerste regel. Heptalogos 11 feb 2009 16:01 (CET)[reageer]

Laatste poging. Ik denk dat je niet erg op de hogte bent van kansrekening, maar ok. Jouw experiment zie er dan zo uit: uitkomstenruimte S={alle bewoners van het land}. Voor een gebeurtenis A (een deel van S) is de kans erop bepaald door: P(A) = (aantal in A)/(aantal in S). Voor S geldt: er zijn evenveel vrouwen als mannen. Dus als V de vrouwen voorstelt, dan geldt dus: P(V)=1/2. Voor de gebeurtenis Noord geldt ook: er zijn evenveel vrouwen als mannen, maar wat betekent dat in termen van kansen? Ik laat je nog even in spanning, probeer het zelf met de bovenstaande terminologie te beschrijven. Madyno 12 feb 2009 00:12 (CET)[reageer]

Ik begrijp dat je geen antwoord wilt geven op mijn vragen zonder allereerst wedervragen beantwoord te zien volgens een systematiek waar niet ik maar jij kennelijk de expert in bent. Louter uit beleefdheid heb ik een poging gewaagd, maar ik vermoed dat het niet leidt tot enig nut t.a.v. de gestelde kwesties.
Ik constateer vooralsnog het volgende:
1. De stelling dat onvoorwaardelijkheid wordt bepaald door beperking van uitkomsten blijft ongefundeerd.
2. Het artikel vermeldt niet expliciet de voorwaarden waaronder noodzakelijke kansrekening nodig c.q. gewenst is.
Aangezien punt 2 afhankelijk is van punt 1, stel ik bij deze voor om de tekst van het artikel te wijzigen mbt 'beperking van uitkomsten' en in plaats hiervan het principe te hanteren zoals gebruikt op de Engelstalige zusterpagina. Graag lees ik reacties op dit voorstel. Heptalogos 12 feb 2009 12:35 (CET)[reageer]

Ik zeg nog dit: een voorwaarde is hetzelfde als een beperking. Dus als je zegt: ik beperk me tot de streek Noord, dan leg je een voorwaarde op. Vandaar dat de "kans" op een vrouw als je je beperkt tot Noord een voorwaardelijke kans is binnen het totale experiment. Madyno 12 feb 2009 12:55 (CET)[reageer]

Ik had het (eerst) eigenlijk beter anders, veel simpeler, kunnen stellen: stel dat je wel degelijk kiest uit de gehele landpopulatie, namelijk een willekeurige persoon, en de kans P(vrouw)=0,5. Nu heb je op een zeker moment als enige extra informatie het gegeven dat de gekozen persoon uit Noord komt. Moet nu een voorwaardelijke kansrekening worden toegepast of blijft de onvoorwaardelijke geldig? Ik begrijp uit bovenstaande dat je antwoord in essentie op hetzelfde neerkomt, maar de stelling is natuurlijk een stuk simpeler. Heptalogos 12 feb 2009 22:55 (CET)[reageer]

Gegeven dat (je weet dat) de gekozen persoon uit Noord komt is natuurlijk nog steeds P(Vrouw) = 1/2, dwz in het hele land is de helft vrouw. Maar jij wilt vermoedelijk weten wat de voorwaardelijke kans is gegeven deze informatie. Die is P(Vrouw|Noord) = P(Vrouw en Noord)/P(Noord), zeg maar het relatieve aandeel van de vrouwen in Noord. Madyno 12 feb 2009 23:13 (CET)[reageer]

Dat is niet mijn vraag. Mijn vraag is welke van de twee berekeningen die je zojuist toepast valide is/zijn, wetende dat gebeurtenis Noord van toepassing is. Heptalogos 12 feb 2009 23:49 (CET)[reageer]

Sorry H. dat staat er. Er staan eigenlijk geen 'berekeningen', en beide zijn valide. Ook als we weten dat Noord is opgetreden, is de kans op een vrouw in het hele land 1/2. De vooraardelijke kans dat de gekozen persoon, die kennelijk uit Noord komt, een vrouw is, is de genoemde P(Vrouw|Noord). Wat valt er meer te zeggen?Madyno 13 feb 2009 00:31 (CET)[reageer]

Bijvoorbeeld dat P(Noord) niet bekend hoeft te zijn, omdat de keuze niet willekeurig is, of omdat de ratio Noord:land onbekend is qua aantallen personen. We weten alleen dat ook in Noord de helft vrouw is. Heptalogos 13 feb 2009 14:06 (CET)[reageer]

Ja, so what? Als in Noord ook evenveel mannen als vrouwen zijn, is de voorwaardelijke kans op een vrouw gegeven Noord 1/2, dus: P(Vrouw|Noord) = 1/2. Madyno 13 feb 2009 17:46 (CET)[reageer]

Weet je wat, laat je berekeningen maar eens zien. Heptalogos 13 feb 2009 22:52 (CET)[reageer]

@Heptalogos. Tot nu toe gaf ik je het voordeel van de twijfel. Weliswaar weet je niets van kansrekening, maat ik ging er vanuit dat je serieus iets wilde opsteken. Dat geloof ik nu niet meer. Madyno 14 feb 2009 18:45 (CET)[reageer]

Ik was al erg benieuwd hoe je je hier nu (weer) uit ging redden. Deze manier is wel erg teleurstellend. Klem gezet met je eigen redenatie nota bene. Analoog hieraan is jouw volgende uitspraak bijzonder treffend: "Actually also Marilyn, yes she, gave the "simple explanation", and being attacked for it, and of course realizing she was wrong, tried in all possible ways to interpret the problem in such a way that she wouldn't have to admit it." Heptalogos 15 feb 2009 22:56 (CET)[reageer]

Waar heb je het over? Je lijkt me tamelijk in de war.Madyno 16 feb 2009 01:02 (CET)[reageer]