NormalizationForm Enumerazione
Definizione
Importante
Alcune informazioni sono relative alla release non definitiva del prodotto, che potrebbe subire modifiche significative prima della release definitiva. Microsoft non riconosce alcuna garanzia, espressa o implicita, in merito alle informazioni qui fornite.
Definisce il tipo di normalizzazione da eseguire.
public enum class NormalizationForm
public enum NormalizationForm
[System.Runtime.InteropServices.ComVisible(true)]
public enum NormalizationForm
type NormalizationForm =
[<System.Runtime.InteropServices.ComVisible(true)>]
type NormalizationForm =
Public Enum NormalizationForm
- Ereditarietà
- Attributi
Campi
| Nome | Valore | Descrizione |
|---|---|---|
| FormC | 1 | Indica che una stringa Unicode viene normalizzata usando la scomposizione canonica completa, seguita dalla sostituzione delle sequenze con i relativi compositi primari, se possibile. |
| FormD | 2 | Indica che una stringa Unicode viene normalizzata usando la scomposizione canonica completa. |
| FormKC | 5 | Indica che una stringa Unicode viene normalizzata usando la scomposizione di compatibilità completa, seguita dalla sostituzione delle sequenze con i relativi compositi primari, se possibile. |
| FormKD | 6 | Indica che una stringa Unicode viene normalizzata usando la scomposizione di compatibilità completa. |
Commenti
Alcune sequenze Unicode sono considerate equivalenti perché rappresentano lo stesso carattere. Ad esempio, i seguenti sono considerati equivalenti perché uno di questi può essere usato per rappresentare "ắ":
"\u1EAF" (U+1EAF LATIN SMALL LETTER A WITH BREVE E ACUTE)
"\u0103\u0301" (U+0103 LATIN SMALL LETTER A WITH BREVE + U+0301 COMBINANDO ACCENTO ACUTO)
"\u0061\u0306\u0301" (U+0061 ALFABETO LATINO MINUSCOLO A + U+0306 COMBINAZIONE BREVE + U+0301 COMBINAZIONE DI ACCENTO ACUTO)
Tuttavia, ordinale, ovvero binario, confronti considerano queste sequenze diverse perché contengono valori di codice Unicode diversi. Prima di eseguire confronti ordinali, le applicazioni devono normalizzare queste stringhe per scomporrle nei componenti di base.
Ogni carattere Unicode composito viene mappato a una sequenza più semplice di uno o più caratteri. Il processo di scomposizione sostituisce i caratteri compositi in una stringa con i relativi mapping più di base. Una scomposizione completa esegue questa sostituzione in modo ricorsivo fino a quando nessuno dei caratteri nella stringa può essere scomposto ulteriormente.
Unicode definisce due tipi di scomposizione: scomposizione della compatibilità e scomposizione canonica. Nella scomposizione della compatibilità, le informazioni di formattazione potrebbero andarsi perse. Nella scomposizione canonica, ovvero un subset di scomposizione di compatibilità, le informazioni di formattazione vengono mantenute.
Due set di caratteri sono considerati equivalenti canonici se le loro scomposizione canoniche complete sono identiche. Analogamente, due set di caratteri vengono considerati equivalenti alla compatibilità se le loro scomposizione di compatibilità completa sono identiche.
Per altre informazioni sulla normalizzazione, le scomposizione e l'equivalenza, vedere Unicode Standard Annex #15: Unicode Normalization Forms at unicode.org.