Закон Ципфа

Если упорядочить слова языка в порядке их частот (вероятностей появления в языке), то частота n_{}-го по порядку слова для всех не слишком больших значений n_{} примерно пропорциональна 1/n. Так, если частота появления первого слова списка равна p_1, то частота появления второго равна p_1/2, третьего — p_1/3, и т.д., десятое слово из списка встречается примерно в 10 раз реже первого. Отношение частоты появления m-го слова к n-му примерно равно n/m .


2016/08/24 18:40 редактировал au