Teclassi el kelmat bel tartib ta3 la fréquence ta3hom, ida zouj kelmat 3andhom fréquence kif kif t9ad tmedelhom rang li tenghi

Formule de Zipf

  • = constante de normalisation = fréquence du mot do rang 1
  • = coefficient = 1 (valeur classique)
  • = rang du mot

Probabilité apparition

  • = i7timal kelma tban
  • = le rang ta3 kelma
  • = rang max li kayen (wela 3adad ta3 les rangs choufha kima tebghi)
  • = constante de normalisation

Conjecture de Luhn:

  • kelma b rang habet bzaf mchi pertinente
  • kelma b rang tale3 bzaf mchi pertinente
  • nos nos 3afsa chaba