Analyser la fréquence des caractères dans le texte avec visualisation en graphique à barres
L'analyse de fréquence des caractères compte la fréquence d'apparition de chaque caractère dans un texte, exprimant les résultats en nombres et pourcentages. C'est l'une des plus anciennes techniques de cryptanalyse — le mathématicien arabe Al-Kindi l'a décrite au IXe siècle.
Au-delà de la cryptographie, l'analyse de fréquence des caractères est utilisée dans la compression de données (codage de Huffman), le traitement du langage naturel et l'analyse typographique.
ETAOIN SHRDLU est l'ordre approximatif des 12 lettres les plus fréquentes en anglais. Il est devenu célèbre car les machines Linotype arrangeaient les touches dans cet ordre pour l'efficacité.
Dans un chiffrement par substitution simple, chaque lettre en texte clair correspond toujours à une lettre en texte chiffré. L'analyse de fréquence exploite le fait que cette correspondance conserve les fréquences des lettres.
La Loi de Zipf stipule que dans le langage naturel, la fréquence d'un mot est inversement proportionnelle à son rang dans le tableau de fréquences.
Le codage de Huffman est un algorithme de compression de données sans perte qui attribue des codes binaires plus courts aux caractères plus fréquents. Utilisé dans deflate (ZIP, gzip, PNG), JPEG, MP3.
Majuscules / Minuscules · Compteur de mots · Compteur de caractères · Générateur Lorem Ipsum · Supprimer les espaces · Trier les lignes de texte