Looking for r Keywords? Try Ask4Keywords

R LanguageReguläre Ausdrücke (Regex)


Einführung

Reguläre Ausdrücke (auch "Regex" oder "Regexp" genannt) definieren Muster, die mit einer Zeichenfolge abgeglichen werden können. Geben Sie ?regex für die offizielle R-Dokumentation ein. Weitere Informationen finden Sie in den Regex- Dokumenten. Der wichtigste ‚Gotcha‘ , die nicht in den SO regex / Themen gelernt wird, ist , dass die meisten R-regex Funktionen die Verwendung von gepaarten Schrägstrichen müssen in einem entkommen pattern - Parametern.

Bemerkungen

Charakterklassen

  • "[AB]" könnte A oder B sein
  • "[[:alpha:]]" könnte ein beliebiger Buchstabe sein
  • "[[:lower:]]" steht für Kleinbuchstaben. Beachten Sie, dass "[az]" nahe ist, aber nicht übereinstimmt, z. B. ú .
  • "[[:upper:]]" steht für Großbuchstaben. Beachten Sie, dass "[AZ]" nahe ist, aber nicht übereinstimmt, z. B. Ú .
  • "[[:digit:]]" steht für eine beliebige Ziffer: 0, 1, 2, ... oder 9 und entspricht "[0-9]" .

Quantifizierer

+ , * und ? gelten wie üblich in Regex. - + stimmt mindestens einmal überein, * entspricht 0 oder mehrmals und ? entspricht 0 oder 1 Mal.

Anfangs- und Endzeilenindikatoren

Sie können die Position des Regex in der Zeichenfolge angeben:

  • "^..." zwingt den regulären Ausdruck am Anfang der Zeichenfolge
  • "...$" zwingt den regulären Ausdruck am Ende der Zeichenfolge

Unterschiede zu anderen Sprachen

Bitte beachten Sie, dass reguläre Ausdrücke in R sucht oft immer so leicht von regulären Ausdrücken in anderen Sprachen verwendet.

  • R erfordert doppelte Backslash-Escape-Zeichen (da "\" bereits generell in R-Strings ein Escape-Zeichen enthält). Um beispielsweise Leerzeichen in den meisten regulären Ausdrucks-Engines zu erfassen, müssen Sie einfach \s , vs. \\s in R eingeben .

  • UTF-8-Zeichen in R sollten mit einem Großbuchstaben U gekennzeichnet werden, z. B. [\U{1F600}] und [\U1F600] stimmen mit whereas überein, wohingegen in Ruby dies mit einem Kleinbuchstaben von u übereinstimmen würde.

Zusätzliche Ressourcen

Die folgende Seite reg101 ist ein guter Ort, um Online-Regex vor der Verwendung des R-Skripts zu überprüfen.

Das R-Programmming-Wikibook enthält eine Seite für die Textverarbeitung mit vielen Beispielen mit regulären Ausdrücken.

Reguläre Ausdrücke (Regex) Verwandte Beispiele