1.425
bewerkingen
(zie engelstalige versie: "Thus the most frequent word will occur approximately twice as often as the second most frequent word, three times as often as the third most frequent word, etc.") |
(zie engelstalige versie: "the frequency of any word is inversely proportional to its rank in the frequency table") |
||
[[Bestand:Zipfcurve.png|miniatuur|Een Zipfdistributie]]
[[Bestand:Wikipedia-n-zipf.png|miniatuur|320px|Een [[log-log-plot]] van de woordfrequentietabel van de Engelstalige wikipedia, op 27 november 2006. De verdeling volgt de wet van Zipf (de groene lijn) voor de acht- à negenduizend meest voorkomende woorden.]]
De '''wet van Zipf''' is oorspronkelijk de door [[George Zipf|George Kingsley Zipf]]<ref>{{en}}G.K. Zipf, ''Selected Studies of the Principle of Relative Frequency in Language'', Harvard University Press, 1932.</ref> geconstateerde en naar hem genoemde wetmatigheid in de [[taalkunde]], dat in natuurlijke taal de frequentie van voorkomen van een woord ruwweg
De constatering door Zipf markeert het begin van de kwantitatieve linguïstiek. Buiten de linguïstiek duikt dit verband evenwel ook in uiteenlopende andere domeinen op. Zo blijkt het verband tussen de rang en de bevolking van de grootste steden in de Verenigde Staten en verschillende andere landen overeen te komen met de wet van Zipf. De "wetenschappelijke productiviteit" (aantal publicaties of referenties naar publicaties van wetenschappers) en het aantal maal per maand dat de webpagina's van een website worden bezocht zijn andere voorbeelden van data die de wet van Zipf volgen.<ref>{{Citeer journal
|
bewerkingen