Overleg:Kwantiel

Pagina-inhoud wordt niet ondersteund in andere talen.
Uit Wikipedia, de vrije encyclopedie

Het begrip kwantiel wordt in het artikel niet eenduidig gedefinieerd. In de eerste paragraaf wordt een kwantiel gedefinieerd als een waarde die een gegevensreeks in twee delen verdeeld. In de laatste paragraaf wordt melding gemaakt van een aantal benoemde kwantielen. Hier handelt het over verdelingen in 4, 10 of 100 delen.

@Patrick: Het is me niet duidelijk wat je met je omschrijving in de intro wil. Bovendien vind ik het te ingewikkeld geformuleerd. Madyno (overleg) 15 jul 2022 09:44 (CEST)[reageer]

We kunnen beginnen met de twee betekenissen van het begrip kwartiel voor een verzameling of multiset getallen te behandelen. Voor gevallen met datatabellen met meer dan één kolom/variabele, kansrekening en meer algemene geordende verzamelingen kunnen ze daarna behandeld worden. - Patrick (overleg) 16 jul 2022 00:06 (CEST)[reageer]
@Patrick: Het wordt steeds onduidelijker. Geef es een voorbeeld waarin jouw formulering noodzakelijk is. Madyno (overleg) 16 jul 2022 11:51 (CEST).[reageer]
Voor de derde alinea (die overigens niet per se in de inleiding hoeft) is de link een voorbeeld. Verder trof ik het artikel aan met een tekst waarin een object werd verward met een waarde, dat heb ik gecorrigeerd. - Patrick (overleg) 16 jul 2022 12:49 (CEST)[reageer]
Snap je het zelf wel? ... een waarde die een op basis van een variabele van een dataset geordende populatie verdeelt in twee delen...???? Madyno (overleg) 16 jul 2022 13:07 (CEST)[reageer]
Het volgens mij goed geformuleerd. Het is een correctie op 'In de statistiek is een kwantiel een getal dat een dataset verdeelt in twee delen, de kleinere en de grotere waarden.' wat onzinnig is als je de link volgt naar dataset, waar je ziet dat er vaak meerdere variabelen zijn. Ik heb hierboven ook voorgesteld het begrip kwartiel voor een verzameling of multiset getallen te behandelen (wat correspondeert met een datatabel met één kolom), dat maakt de formulering eenvoudiger. - Patrick (overleg) 16 jul 2022 13:25 (CEST)[reageer]
Daarom stond er later ook: geordende dataset. Verder is het maar de intro. Madyno (overleg) 16 jul 2022 14:47 (CEST)[reageer]

Overigens lijkt me de uitleg in de inleiding toch wel met een continue kansverdeling te kunnen, want dat is juist eenvoudiger. - Patrick (overleg) 16 jul 2022 12:56 (CEST)[reageer]

Tweede betekenis[brontekst bewerken]

Bij een verdeling door de kwantielen worden ook het minimum en het maximum meegenomen. Dus hoeven eerste en laatste kwantiel niet oneindig lang te zijn. Madyno (overleg) 17 jul 2022 00:27 (CEST)[reageer]

Ik heb het aangepast. - Patrick (overleg) 17 jul 2022 08:51 (CEST)[reageer]

Meerdere variabelen[brontekst bewerken]

Als de dataset de combinaties van inkomen en vermogen betreft, is volgens mij bijv. het mediane inkomen niet de mediaan van de dataset, maar alleen van het inkomen. Dat er daarna over gemiddeld vermogen in het eerste deciel van de inkomens kan worden gesproken, staat daar los van. Madyno (overleg) 17 jul 2022 13:41 (CEST)[reageer]

'De mediaan van de dataset' zou wel vreemd zijn, dat heb ik ook niet geschreven, maar ik het de tekst nog wel wat aangepast. - Patrick (overleg) 17 jul 2022 15:15 (CEST)[reageer]
Wat is nou eigenlijk de essentie van wat je in die sectie wil zeggen? Madyno (overleg) 17 jul 2022 16:10 (CEST)[reageer]
In termen van een datatabel: de inleiding behandelt een datatabel van één kolom getallen, deze paragraaf aan de hand van praktijkvoorbeelden het geval van een datatabel van meerdere kolommen, met een persoon per rij. - Patrick (overleg) 17 jul 2022 22:40 (CEST)[reageer]