Question 1

Qual è la differenza tra un punto di codice Unicode, un carattere e un glifo?

Accepted Answer

Punto di codice: un numero assegnato da Unicode. Carattere: il significato astratto. Glifo: la rappresentazione visuale disegnata da un font. Un punto di codice = un carattere (di solito). Un glifo può combinare più punti di codice.

Question 2

Qual è la differenza tra UTF-8, UTF-16 e UTF-32?

Accepted Answer

Tutti e tre codificano gli stessi punti di codice Unicode. UTF-32 usa esattamente 4 byte per punto di codice. UTF-16 usa 2 byte per BMP e 4 byte per caratteri superiori. UTF-8 usa 1-4 byte. UTF-8 è la codifica web dominante.

Question 3

Cosa sono le categorie Unicode?

Accepted Answer

Unicode assegna a ogni punto di codice una categoria generale: L (Lettera), M (Segno), N (Numero), P (Punteggiatura), S (Simbolo), Z (Separatore), C (Altro). La regex `\p{L}` corrisponde a qualsiasi lettera Unicode.

Question 4

Cosa sono le forme di normalizzazione Unicode?

Accepted Answer

Lo stesso carattere visuale può avere multiple rappresentazioni Unicode: "é" può essere U+00E9 (precomposto) o U+0065 + U+0301 (decomposto). Forme di normalizzazione: NFC (la più compatta, usata sul web), NFD, NFKC, NFKD.

Ispettore Unicode

Che cos'è e come funziona?

Casi d'uso

Domande frequenti

Qual è la differenza tra un punto di codice Unicode, un carattere e un glifo?

Qual è la differenza tra UTF-8, UTF-16 e UTF-32?

Cosa sono le categorie Unicode?

Cosa sono le forme di normalizzazione Unicode?

Testo