正則表達(dá)式是用來(lái)表達(dá)字符串匹配模式的方法,利用正則表達(dá)式,可以讓我們輕易地實(shí)現(xiàn)對(duì)目標(biāo)字符串的 查找 、 刪除 、替換等操作。
正則表達(dá)式并不復(fù)雜,它并不包含難以理解的理論,只是一些約定好的匹配規(guī)則,但由于規(guī)則較多,可能比較容易忘記。
本文會(huì)先整理出所有的正則表達(dá)式以及其含義,接下來(lái)會(huì)利用grep命令,詳細(xì)介紹每種正則表達(dá)式的使用方式,并給出案例。
如果大家忘記了某個(gè)匹配規(guī)則的話,相信你只要再看一遍下方整理好的表格,就能回憶起其使用方法。
正則表達(dá)式規(guī)則
下方表格整理了常用正則表達(dá)式的匹配規(guī)則:
| 表達(dá)式 | 含義 |
|---|---|
| ^word | 匹配關(guān)鍵字出現(xiàn)在行首的行下面命令查詢(xún)以Hello開(kāi)頭的行grep ^Hello regular.txt |
| word** | 匹配關(guān)鍵字出現(xiàn)在行尾的行下面命令查詢(xún)以 complete 結(jié)尾的行grep complete**regular.txt |
| . | 一定存在某個(gè)字符例如a.c可以匹配abc,acc,adc,aec等字符串 |
| \\ | 轉(zhuǎn)義符,去掉特殊符號(hào)的特殊含義下面的命令查找含有單引號(hào)'的行grep \\' regular.txt |
| * | 匹配0個(gè)或無(wú)窮多個(gè)前面的表達(dá)式下面命令查找es,ess,esss,esss...等字符串grep ess* regular.txt |
| [list] | 匹配中括號(hào)中的一個(gè)字符例如,t[ae]st既能匹配test,也能匹配tast |
| [n1-n2] | 是[list]的簡(jiǎn)寫(xiě)形式,匹配兩個(gè)字符之間的所有連續(xù)字符例如,[A-Z]匹配所有的大寫(xiě)字符,[0-9]匹配0和9之間的任意一個(gè)數(shù)字 |
| [^list]或[^n1-n2] | 中括號(hào)中的^是取反的意思,它表示只要一行包含有非list中列出的任意字符,就會(huì)被匹配例如,下面命令查找包含有非大寫(xiě)字符的行grep [^A-Z] regular.txt |
| {n} | 匹配n個(gè)前面的表達(dá)式 |
| {n, m} | 匹配連續(xù)n到m個(gè)前面的表達(dá)式 |
| {n,} | 匹配連續(xù)n個(gè)或以上個(gè)前面的表達(dá)式 |
下面將使用grep命令演示各個(gè)表達(dá)式的執(zhí)行效果,測(cè)試使用的regular.txt文件內(nèi)容如下圖所示:

^word
grep one regular.txt命令的執(zhí)行結(jié)果如下所示:

默認(rèn)條件下,grep命令會(huì)把包含“one”的行都檢索出來(lái)。但如果你只想檢索以“one”開(kāi)頭的行,要使用如下命令:
grep ^one regular.txt
其執(zhí)行結(jié)果如下圖所示:

可以看到只有以“one”開(kāi)頭的行被檢索出來(lái)了,那種雖然包含“one”,但并不以“one”開(kāi)頭的行不會(huì)被檢索到。
word$
$表示只查詢(xún)以某個(gè)關(guān)鍵字結(jié)尾的行:

默認(rèn)條件下,grep命令會(huì)把包含“three”的行都檢索出來(lái)。但使用$后,只有以“three”結(jié)尾的行會(huì)被檢索到。
小數(shù)點(diǎn) .
.表示一定匹配且僅匹配一個(gè)字符。在regular.txt文件中,包含下面幾行:
taste
tst
tesst
test
但執(zhí)行grep t.st regular.txt命令時(shí),只有taste和test兩行內(nèi)容會(huì)被檢索出來(lái):

這是因?yàn)?code>.一定匹配一個(gè)任意字符,所以只有taste和test兩行內(nèi)容滿足要求。
星號(hào) *
*表示重復(fù)任意次前面的表達(dá)式,包括0次和無(wú)窮次。
grep go* regular.txt命令執(zhí)行結(jié)果如下:

g、go、goo、goo...等字符串都會(huì)被檢索到。
[list]
匹配中括號(hào)中的任意一個(gè)字符,注意“[]”表達(dá)式只表示一個(gè)字符,中括號(hào)內(nèi)的字符之間是“或”的關(guān)系。
grep t[ea] regular.txt命令執(zhí)行結(jié)果如下:

tst字符串就沒(méi)有被檢索到,因?yàn)閟不在[ea]范圍內(nèi)。
[n1-n2]
這是對(duì)[list]的簡(jiǎn)寫(xiě)形式,在處理連續(xù)字符集時(shí)很有效。
例如,想要列出所有的小寫(xiě)字母,你可以用“[abcdefg...xyz]”來(lái)表達(dá),但這樣輸入太多,比較麻煩。
由于小寫(xiě)字母是連續(xù)的,所以可以用[a-z]表示所有的小寫(xiě)字母。
grep t[a-z] regular.txt執(zhí)行結(jié)果如下所示:

同理,[A-Z]表示所有大寫(xiě)字母,[0-9]表示所有數(shù)字。
[^list] 或 [^n1-n2]
當(dāng)^出現(xiàn)在中括號(hào)內(nèi)時(shí),它表達(dá)“取反”的含義。
下面是[list]形式使用^符號(hào)的前后結(jié)果對(duì)比:

下面是[n1-n2]形式使用'^'符號(hào)的前后結(jié)果對(duì)比:

, ,
這三種表達(dá)式本質(zhì)上是一類(lèi)表達(dá)式,都是表示前面表達(dá)式重復(fù)的次數(shù)。
go\\{4\\}表示字母g后面必須跟著4個(gè)字母o:

go\\{4,6\\}表示字母g后面跟著4個(gè)字母o到6個(gè)字母o的字符串都是匹配的:

go\\{4,\\}表示字母g后面跟著4個(gè)字母o或超過(guò)4個(gè)字母o的字符串都是匹配的:

這里要注意,grep在使用\\{n,m\\}表達(dá)式時(shí),表達(dá)式內(nèi)容必須用單引號(hào)'或雙引號(hào)"擴(kuò)起來(lái)。其它情況可以不使用雙引號(hào)或單引號(hào)。
反斜杠 \\
\\是轉(zhuǎn)義字符,當(dāng)你要檢索某些特殊字符時(shí),就需要使用它。
例如,下面檢索包含單引號(hào)的行:

這里如果不使用\\,將無(wú)法正常執(zhí)行命令:

—————END—————

技術(shù)人江湖互聯(lián)網(wǎng)技術(shù)分享,Elasticsearch系列教程
67篇原創(chuàng)內(nèi)容
公眾號(hào)
收錄于合集 **#**linux
12個(gè)
上一篇Linux必知必會(huì)10:環(huán)境變量設(shè)置方式及原理
-
Linux
+關(guān)注
關(guān)注
88文章
11758瀏覽量
219009 -
字符串
+關(guān)注
關(guān)注
1文章
596瀏覽量
23165 -
正則表達(dá)式
+關(guān)注
關(guān)注
0文章
28瀏覽量
3850
發(fā)布評(píng)論請(qǐng)先 登錄
什么是正則表達(dá)式?正則表達(dá)式如何工作?哪些語(yǔ)法規(guī)則適用正則表達(dá)式?
shell正則表達(dá)式學(xué)習(xí)
總結(jié)linux腳本語(yǔ)法和正則表達(dá)式的應(yīng)用
深入淺出boost正則表達(dá)式
PHP正則表達(dá)式
關(guān)于java正則表達(dá)式的用法詳解
快速入門(mén)IPv6和正則表達(dá)式
Python正則表達(dá)式的學(xué)習(xí)指南
Python正則表達(dá)式指南
python正則表達(dá)式中的常用函數(shù)
shell腳本基礎(chǔ):正則表達(dá)式grep
Linux入門(mén)之正則表達(dá)式
評(píng)論