Overleg:Correlatie

Pagina-inhoud wordt niet ondersteund in andere talen.
Onderwerp toevoegen
Uit Wikipedia, de vrije encyclopedie
Laatste reactie: 6 jaar geleden door BoH in het onderwerp Coëfficënt

ik heb taallinks toegevoegd voor correlatie, ik vind het raar dat bijvoorbeeld de het engelse artikel voor correlatie en:Correlation verwijst naar Correlatiecoëfficiënt en niet naar correlatie. Engels voor correlatiecoefficient is niet correlation maar correlation coefficient.

Misschien een goed idee om een voorbeeld te nemen aan de engelse Wiki en correlation coefficient te laten linken naar correlatie ipv een apart artikel voor de coefficient te hebben?

Kasper Boers 10 jan 2007 10:25 (CET)Reageren

zie de overlegpagina bij Correlatiecoefficient voor verdere discussie hierover.Kasper Boers 11 jan 2007 13:18 (CET)Reageren

...zal één op de twintig onderzochte relaties statistisch significant zijn...[brontekst bewerken]

Hoezo 20?

Goede vraag, aangezien er geen significatieniveau gespecificeerd is, kun je er mi inderdaad ook niets van zeggen. --Kasper Boers 23 feb 2007 21:57 (CET)Reageren

Er werd in de test gezegd bij alpha = 5% en 100 / 5 is 20. Vandaar dat de auteur bij 20 komt. Ik ken zelf niet zo veel van de geplogenheden met betrekking tot aanpassingen bij wikipedia, maar ik merk wel toevoegingen soms zonder commentaar verwijderd worden, althans dat lijkt zo. Indien men een commentaar verwijdert, staat er dan ergens uitgelegd waarom? Ik heb bijvoorbeeld bij 'correlaties' een correctie aangebracht omdat hetgeen vermeld stond niet klopte, maar deze correctie werd verwijderd! Dank alvast voor een antwoord.

Ik heb je toevoeging "...van een populatie die perfect normaal verdeeld is..." gister, en vandaag weer, verwijderd, omdat deze onjuist is. Zolang je maar de toets gebruikt die bij de verdeling past, geldt altijd dat als je op 5% niveau toetst, je gemiddeld eens in de 20 keer (namelijk 5%) fout zit. CaAl 28 jan 2009 14:32 (CET)Reageren

En toch klopt het niet. De kans van 1 op de 20 geldt alleen als de absolute correlaties van reeksen willekeurige getallen uniform verdeeld zouden zijn tussen 0 en 1. En dat zijn ze niet. Immers, de kans dat twee reeksen van willekeurige getallen als grafiek bijna een rechte lijn laten zien is heel erg klein. Ik heb de proef op de som gedaan: in Excel heb ik 1170 reeksen van elk 20 paren van willekeurige getallen (Excel- RAND functie) gemaakt. Daaruit heb ik de 1170 correlaties berekend. De grafiek van de cumulatieve verdeling van de absolute waarde van de correlaties is:

Volgens de voorspelling van 1 op de 20 zouden zo'n 58 van deze reeksen een correlatie hoger dan 95% moeten laten zien. De verdeling laat zien dat er geen enkele correlatie hoger is dan 0,6. In totaal zijn er 8 correlaties (bijna 0,7% van de 1170) tussen de 0,5 en 0,6 (steeds in absolute waarde). Ik heb de 1 op de 20 weer verwijderd. --JosvanHulzen 29 jan 2010 20:50 (CET)Reageren

Er worden een paar zaken door elkaar gehaald. Toetst men, bij onbetrouwbaarheid 5%, van 1170 reeksen zonder correlatie of er mogelijk correlatie is, dus als nulhypothese: geen correlatie, dan zal in ongeveer 5% van deze 1170, dus ca. 58 gevallen het resultaat toch significant zijn. Dat betekent echter alleen maar dat in die gevallen de berekede correlatiecoefficient significant van 0 afwijkt. Het heeft dus niets te maken met waarden van correlatiecoefficienten in de buurt van 1. Ik heb geen zin het na te rekenen, maar ik vermoed dat een berekende coefficient groter dan 0,5 significant van 0 verschilt in deze gevallen. Madyno 30 jan 2010 22:53 (CET)Reageren
De verdeling van de correlatiecoefficient is inderdaad absoluut niet uniform op (-1, 1). De exacte verdeling is vrij lastig af te leiden en hangt af van de verdeling van de data (bv. bivariaat normaal, of zoals in Jos' voorbeeld bivariaat uniform) en de steekproefgrootte. Ruwweg lijkt het op een klokcurve rond 0; waarbij als je naar de absolute waarden |r| kijkt, je een plaatje zoals die hiernaast krijgt. Zie [1] (als je de goede logingegevens hebt) voor details. CaAl 31 jan 2010 07:51 (CET)Reageren
Uiteraard is de verdeling niet uniform. Voor grote n (hier 20) geldt dat:
bij benadering t-verdeeld is. Vandaar dat de verdeling van r enigzins op een normale verdeling lijkt.Madyno 31 jan 2010 15:04 (CET)Reageren

Enkele vragen over de definitie[brontekst bewerken]

Ik betwijfel of "min of meer" hier op zijn plaats is. Uit het lemma blijkt mij niet waarom die toevoeging nodig zou zijn. Waarom zou dat nodig zijn? Ik betwijfel ook of "lineair" wel tussen haakjes moet. Is er ook sprake van correlatie als er samenhang is die niet lineair is? Mvg, Timelezz (overleg) 21 jul 2014 16:04 (CEST)Reageren

Coëfficënt[brontekst bewerken]

@Boh: misschien is het je ontgaan, maar de link naar correlatiecoëfficiënt is juist een link naar Pearsons product-momentcorrelatiecoëfficiënt. Madyno (overleg) 27 dec 2017 00:49 (CET)Reageren

Nee, dat is slechts een van de coëfficienten die daarin besproken worden, bij gebrek aan een eigen artikel. BoH (overleg) 27 dec 2017 01:12 (CET)Reageren

En??? Madyno (overleg) 27 dec 2017 11:06 (CET)Reageren

Dus is er niets mis met een rode link naar het nog te schrijven Pearsons product-momentcorrelatiecoëfficiënt. BoH (overleg) 27 dec 2017 16:01 (CET)Reageren

Vind je dat nodig? Madyno (overleg) 27 dec 2017 16:51 (CET)Reageren

Ja. BoH (overleg) 27 dec 2017 18:25 (CET)Reageren