Java Language Séquences d'échappement dans les littéraux


Exemple

Les littéraux de chaîne et de caractère fournissent un mécanisme d'échappement qui permet des codes de caractères express qui ne seraient pas autorisés dans le littéral. Une séquence d'échappement consiste en une barre oblique inverse ( \ ) suivie d'un ou plusieurs autres caractères. Les mêmes séquences sont valables dans les deux caractères et les chaînes de caractères.

L'ensemble complet des séquences d'échappement est le suivant:

Séquence d'échappement Sens
\\ Indique une barre oblique inverse ( \ )
\' Indique un caractère de guillemet simple ( ' )
\" Indique un caractère double guillemet ( " )
\n Indique un caractère de LF ligne ( LF )
\r Indique un caractère de retour chariot ( CR )
\t Indique un caractère de tabulation horizontale ( HT )
\f Indique un caractère de flux de formulaire ( FF )
\b Indique un caractère de retour arrière ( BS )
\<octal> Indique un code de caractère compris entre 0 et 255.

Le <octal> ci-dessus consiste en un, deux ou trois chiffres octaux ("0" à "7") qui représentent un nombre compris entre 0 et 255 (décimal).

Notez qu'une barre oblique inverse suivie de tout autre caractère est une séquence d'échappement non valide. Les séquences d'échappement non valides sont traitées comme des erreurs de compilation par le JLS.

Référence:

Unicode s'échappe

En plus des séquences d'échappement de chaînes et de caractères décrites ci-dessus, Java possède un mécanisme d'échappement Unicode plus général, tel que défini dans JLS 3.3. Unicode s'échappe . Une sortie Unicode a la syntaxe suivante:

'\' 'u' <hex-digit> <hex-digit> <hex-digit> <hex-digit> 

<hex-digit> est l'un de '0' , '1' , '2' , '3' , '4' , '5' , '6' , '7' , '8' , '9' , 'a' , 'b' , 'c' , 'd' , 'e' , 'f' , 'A' , 'B' , 'C' , 'D' , 'E' , 'F' .

Un échappement Unicode est mappé par le compilateur Java sur un caractère (à proprement parler une unité de code Unicode 16 bits) et peut être utilisé n'importe où dans le code source où le caractère mappé est valide. Il est couramment utilisé dans les littéraux de caractères et de chaînes lorsque vous devez représenter un caractère non-ASCII dans un littéral.

S'échapper dans les regexes

À déterminer