Looking for unicode Keywords? Try Ask4Keywords

unicodeZeichen können aus mehreren Codepunkten bestehen


Bemerkungen

Ein Unicode-Codepunkt, den Programmierer häufig von einem Zeichen halten, entspricht häufig dem, was der Benutzer für ein Zeichen hält. Manchmal besteht ein „Zeichen“ jedoch aus mehreren Codepunkten, wie die obigen Beispiele zeigen.

Dies bedeutet, dass Operationen wie das Schneiden einer Zeichenkette oder das Abrufen eines Zeichens an einem bestimmten Index möglicherweise nicht wie erwartet funktionieren. Zum Beispiel ist das vierte Zeichen der Zeichenfolge "Café" 'e' (ohne Akzent). Wenn Sie den String auf Länge 4 ausschneiden, wird der Akzent entfernt.

Der Fachbegriff für eine solche Gruppe von Codepunkten ist ein Graphem-Cluster . Siehe UAX Nr. 29: Unicode-Textsegmentierung

Zeichen können aus mehreren Codepunkten bestehen Verwandte Beispiele