Законът на Zipf

Законът на Zipf , с вероятност, твърди, че честотите f на определени събития са обратно пропорционални на техния ранг r . Законът първоначално е предложен от американския лингвист Джордж Кингсли Зипф (1902–50) за честотата на използването на различни думи в английския език; тази честота се дава приблизително от f ( r ) ≅ 0,1 / r . По този начин, най-често срещаната дума (ранг 1) на английски език, който е на , възниква около една десета от времето в типичен текст; следващата най-често срещана дума (ранг 2), която е от , се среща около една двадесета от времето; и т.н. Друг начин да разгледаме това е, че се появява ранг r дума 1 /r пъти по-често от най-често срещаната дума, така че думата ранг 2 се среща наполовина по-често от думата ранг 1, думата ранг 3 една трета толкова често, думата ранг 4 една четвърт толкова често и т.н. След около 1000 ранг, законът напълно се разпада.

Законът на Zipf уж е спазен за много други статистически данни, които следват експоненциално разпределение. Например, през 1949 г. Zipf твърди, че най-големият град в дадена страна е приблизително два пъти по-голям от следващия по големина, три пъти по-голям от третия по големина и т.н. Въпреки че пригодността не е идеална за езици, популации или други данни, основната идея на закона на Zipf е полезна в схеми за компресиране на данни и при разпределяне на ресурси от градоустройството.

Уилям Л. Хош