Question 1

Quali sono le lettere più comuni in inglese?

Accepted Answer

In ordine di frequenza: E (12,7%), T (9,1%), A (8,2%), O (7,5%), I (7,0%), N (6,7%), S (6,3%), H (6,1%), R (6,0%). Il mnemonico "ETAOIN SHRDLU" copre le 12 più comuni.

Question 2

Qual è la differenza tra frequenza di caratteri e frequenza di parole?

Accepted Answer

La frequenza di caratteri conta le singole lettere. La frequenza di parole conta le parole intere come token. Per la crittoanalisi è chiave la frequenza di caratteri; per l'NLP quella delle parole.

Question 3

Cos'è la Legge di Zipf nella frequenza delle parole?

Accepted Answer

La Legge di Zipf afferma che nel linguaggio naturale la frequenza di una parola è inversamente proporzionale al suo rango: la 2ª parola più comune appare circa la metà delle volte rispetto alla 1ª.

Question 4

Come differisce l'Indice di Coincidenza dalla semplice analisi delle frequenze?

Accepted Answer

L'Indice di Coincidenza (IC) misura la probabilità che due caratteri scelti casualmente siano uguali. Inglese: IC ≈ 0,065; testo casuale: IC ≈ 0,038.

Analizzatore di frequenza

Che cos'è e come funziona?

Casi d'uso

Domande frequenti

Quali sono le lettere più comuni in inglese?

Qual è la differenza tra frequenza di caratteri e frequenza di parole?

Cos'è la Legge di Zipf nella frequenza delle parole?

Come differisce l'Indice di Coincidenza dalla semplice analisi delle frequenze?

Dati