Fréquence des caractères

Analyser la fréquence des caractères dans le texte avec visualisation en graphique à barres

Qu'est-ce que c'est et comment ça marche ?

L'analyse de fréquence des caractères compte la fréquence d'apparition de chaque caractère dans un texte, exprimant les résultats en nombres et pourcentages. C'est l'une des plus anciennes techniques de cryptanalyse — le mathématicien arabe Al-Kindi l'a décrite au IXe siècle.

Au-delà de la cryptographie, l'analyse de fréquence des caractères est utilisée dans la compression de données (codage de Huffman), le traitement du langage naturel et l'analyse typographique.

Cas d'usage

Questions fréquentes

Qu'est-ce que l'ordre ETAOIN SHRDLU ?

ETAOIN SHRDLU est l'ordre approximatif des 12 lettres les plus fréquentes en anglais. Il est devenu célèbre car les machines Linotype arrangeaient les touches dans cet ordre pour l'efficacité.

Comment l'analyse de fréquence brise-t-elle un chiffrement par substitution ?

Dans un chiffrement par substitution simple, chaque lettre en texte clair correspond toujours à une lettre en texte chiffré. L'analyse de fréquence exploite le fait que cette correspondance conserve les fréquences des lettres.

Qu'est-ce que la Loi de Zipf ?

La Loi de Zipf stipule que dans le langage naturel, la fréquence d'un mot est inversement proportionnelle à son rang dans le tableau de fréquences.

Qu'est-ce que le codage de Huffman ?

Le codage de Huffman est un algorithme de compression de données sans perte qui attribue des codes binaires plus courts aux caractères plus fréquents. Utilisé dans deflate (ZIP, gzip, PNG), JPEG, MP3.

Texte

Majuscules / Minuscules · Compteur de mots · Compteur de caractères · Générateur Lorem Ipsum · Supprimer les espaces · Trier les lignes de texte