Confronta due testi e calcola la percentuale di similarità
Un controllore di similarità del testo confronta due testi e dà una percentuale che mostra quanto si somigliano, usando la distanza di Levenshtein — una misura di quante modifiche di un singolo carattere (inserzioni, eliminazioni o sostituzioni) servono per trasformare una stringa nell'altra. Meno modifiche servono, più i testi sono simili, e lo strumento converte quel conteggio di modifiche in un punteggio di similarità facile da leggere. Risponde a domande come "quanto sono vicine queste due versioni?" con un numero invece di un'impressione vaga.
È utile ovunque le corrispondenze approssimate contino: individuare voci quasi duplicate in un elenco, misurare quanto è cambiata una bozza tra le revisioni, fare corrispondenze fuzzy di nomi o titoli di prodotto scritti un po' diversamente, o controllare quanto un testo è vicino a un altro. A differenza di un confronto esatto che dice solo "uguale o diverso", la distanza di Levenshtein gradua il grado di differenza, il che rende significativa una percentuale. Questo strumento calcola il confronto nel browser, quindi nessuno dei due testi viene caricato.
È il numero minimo di modifiche di un singolo carattere — inserzioni, eliminazioni o sostituzioni — necessarie per trasformare una stringa in un'altra. Da "cat" a "cot" è una distanza di 1 (una sostituzione). Una distanza minore significa testo più simile; lo strumento converte questo conteggio in una percentuale.
La distanza di modifica viene confrontata con la lunghezza del testo, quindi il conteggio dei cambiamenti viene scalato in un punteggio di similarità da 0 a 100%. Due testi identici segnano 100%, e la percentuale cala man mano che servono più modifiche, dando una misura intuitiva invece di un conteggio grezzo di modifiche.
Solo i caratteri. Levenshtein misura la distanza di modifica a livello superficiale, quindi "big" e "large" segnano come molto diversi nonostante significhino lo stesso. È ideale per cogliere errori di battitura e quasi-duplicati, ma non cattura la similarità semantica come farebbe un confronto basato sul significato.
Per impostazione predefinita i confronti tra caratteri trattano maiuscolo e minuscolo come diversi, quindi "Cat" e "cat" registrano una piccola differenza. Molti controllori ti lasciano normalizzare prima le maiuscole se vuoi ignorarle, il che è utile quando la capitalizzazione non dovrebbe contare come una differenza reale.
Maiuscolo / Minuscolo · Contatore di parole · Contatore di caratteri · Generatore Lorem Ipsum · Rimuovi spazi extra · Ordina righe di testo