Question 1

Quelles sont les lettres les plus courantes en anglais ?

Accepted Answer

Par ordre de fréquence : E (12,7%), T (9,1%), A (8,2%), O (7,5%), I (7,0%), N (6,7%), S (6,3%), H (6,1%), R (6,0%). Le moyen mnémotechnique "ETAOIN SHRDLU" couvre les 12 plus courantes.

Question 2

Quelle est la différence entre fréquence de caractères et fréquence de mots ?

Accepted Answer

La fréquence de caractères compte les lettres individuelles. La fréquence de mots compte les mots entiers. Pour la cryptanalyse, la fréquence de caractères est clé ; pour le NLP, la fréquence de mots.

Question 3

Qu'est-ce que la loi de Zipf ?

Accepted Answer

La loi de Zipf stipule que dans le langage naturel, la fréquence d'un mot est inversement proportionnelle à son rang : le 2ème mot le plus fréquent apparaît environ moitié moins souvent que le 1er.

Question 4

Comment l'indice de coïncidence diffère-t-il de la simple analyse de fréquence ?

Accepted Answer

L'indice de coïncidence (IC) mesure la probabilité que deux caractères aléatoirement choisis soient identiques. Anglais : IC ≈ 0,065 ; texte aléatoire : IC ≈ 0,038.

Analyseur de fréquence

Qu'est-ce que c'est et comment ça marche ?

Cas d'usage

Questions fréquentes

Quelles sont les lettres les plus courantes en anglais ?

Quelle est la différence entre fréquence de caractères et fréquence de mots ?

Qu'est-ce que la loi de Zipf ?

Comment l'indice de coïncidence diffère-t-il de la simple analyse de fréquence ?

Données