Wenn dieses Flag angegeben wird, wird die Eingabezeichenfolge, die das Muster angibt, als eine Sequenz von Literalzeichen behandelt. Metazeichen oder Escapesequenzen in der Eingabesequenz erhalten keine besondere Bedeutung. Die kompilierten Versionen der neuesten Muster, die an re.compile() übergeben wurden, und die Anpassungsfunktionen auf Modulebene werden zwischengespeichert, sodass Programme, die nur wenige reguläre Ausdrücke gleichzeitig verwenden, sich keine Gedanken über das Kompilieren regulärer Ausdrücke machen müssen. Um beispielsweise die Zeilen zu finden, die zu oder zwei enthalten, geben Sie diese Variationen prägnant an, indem Sie das folgende Muster verwenden: Oft müssen Sie sich entscheiden, ob Sie Großbuchstaben [A-Z] erzwingen oder später per Skript konvertieren möchten. Für die IBAN (DE1212345678901234567890) ist die Ländervorwahl immer in Großbuchstaben und hat keine Räume, aber für Menschen ist es einfacher, diese lange Kette in Gruppen, d.h. mit Leerzeichen, zu betreten. (DE12 1234 5678 9012 3456 7890). Dies muss dann bei der Weiterverarbeitung korrigiert werden. Manchmal gibt es andere Regeln für Maschine und Mensch-Maschine.

Das müssen wir bei unserer Prototypenarbeit berücksichtigen. Letztlich ist es die Entscheidung des Musterherstellers, dem Benutzer bei der Eingabe der Daten Zugeständnisse zu machen und dann die Vorschriften mittels Scripting einzuhalten. Die Regeln des Formulareingabemusters folgen den Regeln des RegEx von Javascript, aber es gibt Unterschiede. Die Start- und Endbezeichner, die für Programmiersprachen erforderlich sind … – müssen nicht mit HTML5-Muster verwendet werden. Sie sehen oft diese «[0-9]{5}, und es führt offensichtlich nicht zu einem Fehler, aber wie Sie wissen, wird die gesamte Eingabe immer verglichen. Darüber müssen Sie sich auch keine Sorgen machen. Der richtige Weg ist einfach: [0-9]{5}. Reguläre Ausdrücke entstanden 1951, als der Mathematiker Stephen Cole Kleene reguläre Sprachen mit seiner mathematischen Notation, die als regelmäßige Ereignisse bezeichnet wird, beschrieb. [4] [5] Diese entstanden in der theoretischen Informatik, in den Unterfeldern der Automatentheorie (Berechnungsmodelle) und der Beschreibung und Klassifizierung formaler Sprachen. Andere frühe Implementierungen des Musterabgleichs umfassen die SNOBOL-Sprache, die keine regulären Ausdrücke, sondern eigene Musterübereinstimmungskonstrukte verwendet. Jeffrey Friedl.

Beherrschen regulärer Ausdrücke. 3rd ed., O`Reilly Media, 2009. Die dritte Ausgabe des Buches deckt Python überhaupt nicht mehr ab, aber die erste Ausgabe behandelte das Schreiben guter regulärer Ausdrucksmuster im Detail. Beachten Sie, dass bei Verwendung der Unicode-Muster [a-z] oder [A-Z] in Kombination mit dem IGNORECASE-Flag sie entsprechen den 52 ASCII-Buchstaben und 4 weiteren Nicht-ASCII-Buchstaben: «` (U+0130, lateinischer Großbuchstabe I mit Punkt oben), «` (U+0131, lateinischer kleiner Buchstabe punktlos i), `s` (U+017F, lateinischer Kleinbuchstabe lang) und `K` (U+212A, Kelvin-Zeichen). Wenn das ASCII-Flag verwendet wird, werden nur die Buchstaben «a» bis «z» und «A» bis «Z» übereinstimmen. Kompiliert den angegebenen regulären Ausdruck in ein Muster. Reguläre Ausdrücke können sowohl spezielle als auch gewöhnliche Zeichen enthalten. Die meisten gewöhnlichen Zeichen, wie `A`, `a` oder `0`, sind die einfachsten regulären Ausdrücke; sie passen einfach zu sich selbst. Sie können gewöhnliche Zeichen verketten, so dass zuletzt die Zeichenfolge `last` übereinstimmt. (Im Rest dieses Abschnitts schreiben wir RE es in diesem speziellen Stil, in der Regel ohne Anführungszeichen, und Zeichenfolgen, die `in einfache Anführungszeichen` abgeglichen werden sollen.) Diese Methode erzeugt eine Zeichenfolge, die verwendet werden kann, um ein Muster zu erstellen, das mit der Zeichenfolge s übereinstimmt, als wäre es ein Literalmuster. Theoretisch kann jeder Tokensatz mit regulären Ausdrücken abgeglichen werden, solange er vordefiniert ist.

In Bezug auf historische Implementierungen wurden Regexe ursprünglich geschrieben, um ASCII-Zeichen als Tokensatz zu verwenden, obwohl Regex-Bibliotheken zahlreiche andere Zeichensätze unterstützt haben.