這部分理解一下數(shù)量詞,為什么要用數(shù)量詞,想想都知道,如果你要匹配幾十上百的字符時,難道你要一個一個的寫,所以就出現(xiàn)了數(shù)量詞。
數(shù)量詞的詞法是:{min,max} 。min 和 max 都是非負整數(shù)。如果逗號有而 max 被忽略了,則 max 沒有限制。如果逗號和 max 都被忽略了,則重復 min 次。比如,\b[1-9][0-9]{3}\b,匹配的是 1000 ~ 9999 之間的數(shù)字( “\b” 表示單詞邊界),而 \b[1-9][0-9]{2,4}\b,匹配的是一個在 100 ~ 99999 之間的數(shù)字。
下面看一個實例,匹配出字符串中 4 到 7 個字母的英文
import re
a = 'java*&39android##@@python'
# 數(shù)量詞
findall = re.findall('[a-z]{4,7}', a)
print(findall)
輸出結果:
['java', 'android', 'python']
注意,這里有貪婪和非貪婪之分。那么我們先看下相關的概念:
貪婪模式:它的特性是一次性地讀入整個字符串,如果不匹配就吐掉最右邊的一個字符再匹配,直到找到匹配的字符串或字符串的長度為 0 為止。它的宗旨是讀盡可能多的字符,所以當讀到第一個匹配時就立刻返回。
懶惰模式:它的特性是從字符串的左邊開始,試圖不讀入字符串中的字符進行匹配,失敗,則多讀一個字符,再匹配,如此循環(huán),當找到一個匹配時會返回該匹配的字符串,然后再次進行匹配直到字符串結束。
上面例子中的就是貪婪的,如果要使用非貪婪,也就是懶惰模式,怎么呢?
如果要使用非貪婪,則加一個 ? ,上面的例子修改如下:
import re
a = 'java*&39android##@@python'
# 貪婪與非貪婪
re_findall = re.findall('[a-z]{4,7}?', a)
print(re_findall)
輸出結果如下:
['java', 'andr', 'pyth']
從輸出的結果可以看出,android 只打印除了 andr ,Python 只打印除了 pyth ,因為這里使用的是懶惰模式。
當然,還有一些特殊字符也是可以表示數(shù)量的,比如:
?:告訴引擎匹配前導字符 0 次或 1 次
+:告訴引擎匹配前導字符 1 次或多次
*:告訴引擎匹配前導字符 0 次或多次
把這部分的知識點總結一下,就是下面這個表了:
| 貪 婪 | 惰 性 | 描 述 |
|---|---|---|
| ? | ?? | 零次或一次出現(xiàn),等價于{0,1} |
| + | +? | 一次或多次出現(xiàn) ,等價于{1,} |
| * | *? | 零次或多次出現(xiàn) ,等價于{0,} |
| {n} | {n}? | 恰好 n 次出現(xiàn) |
| {n,m} | {n,m}? | 至少 n 次枝多 m 次出現(xiàn) |
| {n,} | {n,}? | 至少 n 次出現(xiàn) |
審核編輯:湯梓紅
-
字符串
+關注
關注
1文章
596瀏覽量
23166 -
python
+關注
關注
57文章
4876瀏覽量
90039
發(fā)布評論請先 登錄
布爾表達式及范圍檢查
C語言的分支結構介紹
第4章 C語言基礎以及流水燈的實現(xiàn)(4.5 4.6)
inline ASM(內(nèi)聯(lián)匯編)的細節(jié)分享
labview如何使用VISA串口資源查找的正則表達式提取串口的資源名稱?
基礎篇3:掌握Python中的條件語句與循環(huán)
Cubeide1.18.1在線調試改變\"現(xiàn)場表達式\"中的值提示找不到地址,為什么?
《ESP32S3 Arduino開發(fā)指南》第三章 C/C++語言基礎
Cubeide1.18.1在線調試改變\"現(xiàn)場表達式\"中的值提示找不到地址是怎么回事?
干貨分享 | 零基礎上手!TSMaster圖形信號表達式實操指南
Cubeide1.18.1在線調試改變\"現(xiàn)場表達式\"中的值提示找不到地址,怎么解決?
Cubeide1.18.1在線調試改變\"現(xiàn)場表達式\"中的值提示找不到地址怎么解決?
Linux中文本處理命令的用法
詳解python正則表達式數(shù)量詞
評論