模式字符串使用特殊的语法来表示一个正则表达式:
字母和数字表示他们自身。一个正则表达式模式中的字母和数字匹配同样的字符串。
多数字母和数字前加一个反斜杠时会拥有不同的含义。标点符号只有被转义时才匹配自身,否则它们表示特殊的含义。
反斜杠本身需要使用反斜杠转义。由于正则表达式通常都包含反斜杠,所以你最好使用原始字符串来表示它们。模式元素匹配相应的特殊字符。下面列出了正则表达式模式语法中的特殊元素。如果你使用模式的同时提供了可选的标志参数,某些模式元素的含义会改变。
注释
(?#…)
匹配字符串的开头
^
匹配字符串的末尾
$
匹配0个或多个的表达式
re*
匹配1个或多个的表达式
re+
匹配任意非空字符
\S
匹配任意非数字
\D
匹配字符串开始
\A
匹配字符串结束
\z
匹配a或b
a| b