NormalizationForm Enumeração
Definição
Importante
Algumas informações dizem respeito a um produto pré-lançado que pode ser substancialmente modificado antes de ser lançado. A Microsoft não faz garantias, de forma expressa ou implícita, em relação à informação aqui apresentada.
Define o tipo de normalização a realizar.
public enum class NormalizationForm
public enum NormalizationForm
[System.Runtime.InteropServices.ComVisible(true)]
public enum NormalizationForm
type NormalizationForm =
[<System.Runtime.InteropServices.ComVisible(true)>]
type NormalizationForm =
Public Enum NormalizationForm
- Herança
- Atributos
Campos
| Name | Valor | Description |
|---|---|---|
| FormC | 1 | Indica que uma cadeia Unicode é normalizada usando decomposição canónica completa, seguida da substituição das sequências pelos seus compostos primários, se possível. |
| FormD | 2 | Indica que uma cadeia Unicode é normalizada usando decomposição canónica completa. |
| FormKC | 5 | Indica que uma cadeia Unicode é normalizada usando decomposição de compatibilidade total, seguida da substituição das sequências pelos seus compostos primários, se possível. |
| FormKD | 6 | Indica que uma cadeia Unicode é normalizada usando decomposição total de compatibilidade. |
Observações
Algumas sequências Unicode são consideradas equivalentes porque representam o mesmo carácter. Por exemplo, os seguintes são considerados equivalentes porque qualquer um destes pode ser usado para representar "ắ":
"\u1EAF" (U+1EAF, LATIM A MINÚSCULO COM BREVE E AGUDO)
"\u0103\u0301" (U+0103 LETRA LATINA MINÚSCULA A COM BREVE + U+0301 COMBINANDO ACENTO AGUDO)
"\u0061\u0306\u0301" (U+0061 LATIM LETRA MINÚSCULA A + U+0306 COMBINANDO BREVE + U+0301 COMBINANDO O ACENTO AGUDO)
No entanto, as comparações ordinais, ou seja, binárias, consideram estas sequências diferentes porque contêm valores de código Unicode diferentes. Antes de realizar comparações ordinais, as aplicações devem normalizar estas cadeias para as decompor nos seus componentes básicos.
Cada carácter Unicode composto é mapeado para uma sequência mais básica de um ou mais caracteres. O processo de decomposição substitui caracteres compostos numa cadeia de caracteres pelos seus mapeamentos mais básicos. Uma decomposição completa executa recursivamente esta substituição até que nenhum dos caracteres da cadeia possa ser decomposto mais.
O Unicode define dois tipos de decomposições: decomposição de compatibilidade e decomposição canónica. Na decomposição por compatibilidade, a informação de formatação pode ser perdida. Na decomposição canónica, que é um subconjunto da decomposição de compatibilidade, a informação de formatação é preservada.
Dois conjuntos de caracteres são considerados como tendo equivalência canónica se as suas decomposições canónicas completas forem idênticas. Da mesma forma, dois conjuntos de caracteres são considerados como tendo equivalência de compatibilidade se as suas decomposições completas de compatibilidade forem idênticas.
Para mais informações sobre normalização, decomposições e equivalência, consulte o Anexo Padrão Unicode #15: Formulários de Normalização Unicode em unicode.org.