正規表達式的強大之處在於能夠在模式中包含替代方案和重複。這些替代方案和重複會使用中繼字元在模式中編碼,中繼字元本身並不代表字面意義,而會以特殊方式詮釋。
有兩組不同的中繼字元:一組在模式中的任何位置(方括號內除外)都會被識別,另一組則在方括號內被識別。在方括號外,中繼字元如下:
| 中繼字元 | 說明 |
|---|---|
| \ | 通用跳脫字元,有多種用途 |
| ^ | 斷言目標的開頭(或多行模式下的行首) |
| $ | 斷言主體結尾或終止換行符之前(或在多行模式下為行尾) |
| . | 匹配除換行符以外的任何字符(預設) |
| [ | 開始字符類別定義 |
| ] | 結束字符類別定義 |
| | | 開始分支選項 |
| ( | 開始子模式 |
| ) | 結束子模式 |
| ? | 擴展 ( 的含義,也是 0 或 1 量詞,也使貪婪量詞變為惰性(參見 重複) |
| * | 0 或更多次量詞 |
| + | 1 或更多次量詞 |
| { | 開始最小/最大量詞 |
| } | 結束最小/最大量詞 |
| 中繼字元 | 說明 |
|---|---|
| \ | 一般跳脫字符 |
| ^ | 否定類別,但僅當它是第一個字符時 |
| - | 指示字符範圍 |