unicodeLos personajes pueden constar de múltiples puntos de código


Observaciones

Un punto de código Unicode, lo que los programadores a menudo piensan en un personaje, a menudo corresponde a lo que el usuario piensa que es un personaje. A veces, sin embargo, un "carácter" se compone de múltiples puntos de código, como muestran los ejemplos anteriores.

Esto significa que las operaciones como cortar una cadena o obtener un carácter en un índice determinado pueden no funcionar como se espera. Por ejemplo, el carácter de la cadena "Café" es 'e' (sin el acento). Del mismo modo, cortar la cuerda a la longitud 4 eliminará el acento.

El término técnico para tal grupo de puntos de código es un grupo de grafemas . Ver UAX # 29: Segmentación de texto Unicode

Los personajes pueden constar de múltiples puntos de código Ejemplos relacionados