Wet van Zipf
De Wet van Zipf is oorspronkelijk de door George Kingsley Zipf geconstateerde en naar hem genoemde wetmatigheid in de linguïstiek dat in natuurlijke taal de frequentie van voorkomen van een woord ruwweg omgekeerd evenredig is met de rang van het woord in de frequentietabel, en wel zo dat het meest frequente woord ongeveer twee keer zo vaak voorkomt als het op een na frequentste woord en dat weer twee keer zo vaak als het vierde frequentste, enz. Met de Wet van Zipf worden tegenwoordig kansverdelingen aangeduid die de vorm van een machtswet hebben. De wet kan gekarakteriseerd worden door het lineaire verband tussen de logaritmen van rangnummer en kans of frequentie. Uitgezet op dubbellogaritmisch papier is het verband een rechte lijn.
De constatering door Zipf markeert het begin van de kwantitatieve linguïstiek.
[bewerken] Definitie
Onder een verdeling volgens de wet van Zipf, of kort een Zipf-verdeling, verstaat men een discrete kansverdeling met parameters λ en N van de vorm:
voor n=1,...,N.
Ze is later gebruikt voor onder meer de Wet van Bradford (sociale wetenschappen) en het Paretoprincipe (economie).
[bewerken] Zie ook
[bewerken] Referenties
- Newman, M. E. J. (2005). Power laws, Pareto distributions and Zipf's law. Contemporary Physics 46: 323–351. DOI:10.1080/00107510500052444.

voor n=1,...,N.