Digital First: Loading

Regex:
Zeichenfolgen
schnell
und
effizient
überprüfen

2020-08-regex-post

Sie beginnen mit dem Schreiben von Skripten und Programmen und merken, dass Sie immer wieder auf ähnliche Aufgaben stoßen. Statt umständliche Konstruktionen aus Schleifen und Abfragen zu bauen, empfehle ich: Regex!

In diesem Blog will ich Ihnen näher bringen, was Regex konkret kann und wofür wir es verwenden. Meine Beispiele zeigen: Es ist gar nicht so kompliziert, wie es scheint.

Was ist Regex?

In der allgemeinen Informatik ist eine Regular Expression (abgekürzt als Regex oder RegExp) ein regulärer Ausdruck. Also eine Zeichenfolge, mit der eine Reihe von Zeichenfolgen mithilfe einiger Syntaxregeln beschrieben wird. Diese sind vor allem in der Softwareentwicklung und im Webdesign in Verwendung. Regex ist zum Beispiel bei Anwendungen wichtig, die Eingaben des Benutzers erwarten. Das ist etwa bei bei Online-Formularen der Fall. 

Wofür Sie eine Regular Expression brauchen.

Ein Regex kann Ihnen den Alltag als Programmierer und Softwareentwickler gleich mehrfach erleichtern. 
 
  • Formate überprüfen: Mit dem regulären Ausdruck wird die Richtigkeit eines Formats oder einer Syntax geprüft.
  • Texte durchsuchen: Hilft bei der Zerlegung von Texten nach bestimmten Regeln. Regex setzt etwa spezifische Filter ein, so können Texte einfacher nach Keywords durchsucht werden.
  • Eingaben untersuchen: Regex überprüft die Webformulare nach gültigen Eingaben des Benutzers.
  • Einheitliche Sprache: Alle Beteiligten arbeiten mit denselben Ausdrücken, was die Kommunikation vereinfacht.

Worauf Sie beim Einsatz von Regex achten sollten.

Wenn man mit Anweisungen für reguläre Ausdrücke arbeiten möchte, hat man viel Freiheit, da es für jede Aufgabe, die mit einem regulären Ausdruck gelöst werden soll, immer mehrere Lösungsoptionen gibt.

Es ist jedoch nicht immer von Vorteil, dass ein gewünschtes Ergebnis auf unterschiedliche Weise erzielt wird: Beispielsweise können die allgemeinen Anweisungen für ein Ergebnis zu restriktiv sein. Eine Übersicht über die Länge kann ich ebenfalls empfehlen. Je kompakter ein regulärer Ausdruck ist, desto kürzer ist seine Verarbeitungszeit.

Wie funktioniert ein Regulärer Ausdruck?

Optional kann ein regulärer Ausdruck nur mit normalen Zeichen (abc) oder einer Kombination aus normalen Zeichen und Metazeichen (ab * c) gebildet werden. Das sind Metazeichen: [ ] ( ) { } | ? + - * . ^ $ \

Metazeichen haben die Aufgabe, bestimmte Konstruktionen oder Anordnungen von Zeichen zu beschreiben, wie etwa ob ein Zeichen am Anfang der Zeile stehen soll oder ob ein Zeichen genau einmal, öfter oder seltener vorkommen kann.

Die Regex-Grundregeln.

Ich habe für Sie einige Regex-Grundregeln zusammengefasst, die mich im Alltag unterstützen. 

Regex Zeichenfolge 2 MASSIVE ART

Verwendung von vordefinierten Zeichenklassen.

Es gibt aber auch noch vordefinierte Zeichenklassen. Sie machen die regulären Ausdrücke kürzer und einfacher.

Regex Zeichenabfolge 1MASSIVE ART

Regex am komplexeren Beispiel: Validierung von E-Mail-Adressen

Die Validierung einer eingegebenen E-Mail-Adresse erfordert einen komplexeren Ausdruck. Im Formular wird die Eingabe type=email verwendet, aber im Hintergrund findet die Prüfung mit einem Regulären Ausdruck statt. Wie hier zum Beispiel:
 

[A-Za-z0-9\-\_\.\+]{1,64}@[A-Za-z0-9\-\_\.]+\.[a-zA-Z]+


Der Ausdruck vor dem @-Zeichen definiert die erlaubten Zeichen und die maximale Zeichenlänge für den verwendeten Namen. Nach dem @-Zeichen definiert es die erlaubten Zeichen.

Mein Fazit

Reguläre Ausdrücke scheinen am Anfang recht kompliziert zu sein. Wenn man sich damit auseinandersetzt wird einem klar, wie schnell ganze Zeichenketten überprüft werden können. Und auch wenn ein regulärer Ausdruck je nach Anforderung sehr komplex werden kann, ist Regex für mich immer eine super Unterstützung in der Softwareentwicklung.

 

Mehr Blogartikel zum Thema:

loading
Nach oben