Teclassi el kelmat bel tartib ta3 la fréquence ta3hom, ida zouj kelmat 3andhom fréquence kif kif t9ad tmedelhom rang li tenghi
Formule de Zipf
- = constante de normalisation = fréquence du mot do rang 1
- = coefficient = 1 (valeur classique)
- = rang du mot
Probabilité apparition
- = i7timal kelma tban
- = le rang ta3 kelma
- = rang max li kayen (wela 3adad ta3 les rangs choufha kima tebghi)
- = constante de normalisation
Conjecture de Luhn:
- kelma b rang habet bzaf mchi pertinente
- kelma b rang tale3 bzaf mchi pertinente
- nos nos 3afsa chaba