NormalizationForm Enumeração

Definição

Espaço de Nomes:: System.Text

Assemblagens:: mscorlib.dll, System.Globalization.Extensions.dll

Assemblagem:: mscorlib.dll

Assemblagem:: netstandard.dll

Importante

Algumas informações dizem respeito a um produto pré-lançado que pode ser substancialmente modificado antes de ser lançado. A Microsoft não faz garantias, de forma expressa ou implícita, em relação à informação aqui apresentada.

Define o tipo de normalização a realizar.

public enum class NormalizationForm

public enum NormalizationForm

[System.Runtime.InteropServices.ComVisible(true)]
public enum NormalizationForm

type NormalizationForm =

[<System.Runtime.InteropServices.ComVisible(true)>]
type NormalizationForm =

Public Enum NormalizationForm

Herança: Object

ValueType

Enum
NormalizationForm

Atributos: ComVisibleAttribute

Campos

Name	Valor	Description
FormC	1	Indica que uma cadeia Unicode é normalizada usando decomposição canónica completa, seguida da substituição das sequências pelos seus compostos primários, se possível.
FormD	2	Indica que uma cadeia Unicode é normalizada usando decomposição canónica completa.
FormKC	5	Indica que uma cadeia Unicode é normalizada usando decomposição de compatibilidade total, seguida da substituição das sequências pelos seus compostos primários, se possível.
FormKD	6	Indica que uma cadeia Unicode é normalizada usando decomposição total de compatibilidade.

Observações

Algumas sequências Unicode são consideradas equivalentes porque representam o mesmo carácter. Por exemplo, os seguintes são considerados equivalentes porque qualquer um destes pode ser usado para representar "ắ":

"\u1EAF" (U+1EAF, LATIM A MINÚSCULO COM BREVE E AGUDO)
"\u0103\u0301" (U+0103 LETRA LATINA MINÚSCULA A COM BREVE + U+0301 COMBINANDO ACENTO AGUDO)
"\u0061\u0306\u0301" (U+0061 LATIM LETRA MINÚSCULA A + U+0306 COMBINANDO BREVE + U+0301 COMBINANDO O ACENTO AGUDO)

No entanto, as comparações ordinais, ou seja, binárias, consideram estas sequências diferentes porque contêm valores de código Unicode diferentes. Antes de realizar comparações ordinais, as aplicações devem normalizar estas cadeias para as decompor nos seus componentes básicos.

Cada carácter Unicode composto é mapeado para uma sequência mais básica de um ou mais caracteres. O processo de decomposição substitui caracteres compostos numa cadeia de caracteres pelos seus mapeamentos mais básicos. Uma decomposição completa executa recursivamente esta substituição até que nenhum dos caracteres da cadeia possa ser decomposto mais.

O Unicode define dois tipos de decomposições: decomposição de compatibilidade e decomposição canónica. Na decomposição por compatibilidade, a informação de formatação pode ser perdida. Na decomposição canónica, que é um subconjunto da decomposição de compatibilidade, a informação de formatação é preservada.

Dois conjuntos de caracteres são considerados como tendo equivalência canónica se as suas decomposições canónicas completas forem idênticas. Da mesma forma, dois conjuntos de caracteres são considerados como tendo equivalência de compatibilidade se as suas decomposições completas de compatibilidade forem idênticas.

Para mais informações sobre normalização, decomposições e equivalência, consulte o Anexo Padrão Unicode #15: Formulários de Normalização Unicode em unicode.org.

Aplica-se a

Ver também

Comentários

Esta página foi útil?