五月综合缴情婷婷六月,色94色欧美sute亚洲线路二,日韩制服国产精品一区,色噜噜一区二区三区,香港三级午夜理伦三级三

您現(xiàn)在的位置: 365建站網(wǎng) > 365文章 > 正則表達(dá)式匹配不包含某些字符串的方法

正則表達(dá)式匹配不包含某些字符串的方法

文章來(lái)源:365jz.com     點(diǎn)擊數(shù):2008    更新時(shí)間:2017-08-09 16:03   參與評(píng)論
找出所有img標(biāo)簽的,沒(méi)有帶說(shuō)明屬性alt的標(biāo)簽: 

正則:<img(?![^<>]*?alt[^<>]*?>).*?> 
例子:<img src="" alt=""> <img src="" >  <img src="" title="">  <img src="" id="">  <img src=""  title="" alt=""> 


擴(kuò)展,如果要找沒(méi)有帶title屬性的a應(yīng)該是: 

正則:<a(?![^<>]*?title[^<>]*?>).*?> 
例子:<a src="" alt=""> <a src="" >  <a src="" title="">  <a src="" id="">  <a src=""  title="" alt=""> 
用正則表達(dá)式找出不包含連續(xù)字符串a(chǎn)bc的單詞 

[^abc]表示不包含a、b、c中任意字符, 我想實(shí)現(xiàn)不包含字符串a(chǎn)bc應(yīng)該如何寫(xiě)表達(dá)式? 

就我自己而言,這個(gè)問(wèn)題最簡(jiǎn)單的解決方法是使用編程語(yǔ)言的配合,找出那些包含abc的,剩下的就是不包含的了——懶人的風(fēng)格。但我寫(xiě)的是教程,讀者未必都有編程的基礎(chǔ),有些只是使用一些工具從txt文檔中抽取出一些信息,所以要回答還是必須完全通過(guò)正則表達(dá)式來(lái)完成。 

于是打開(kāi)了RegexTester,開(kāi)始試驗(yàn),先是試了使用((?'test'abc)|.)*(?(test)(?!))(含意是:查找abc,或任意的字符,如果找到了abc,就把它存入命名為test的組里,到最后檢查test組里是否有內(nèi)容,如果有就匹配失敗,相關(guān)說(shuō)明見(jiàn)教程),結(jié)果是"abc","aabc","abcd","aa"都能通過(guò)測(cè)試,看來(lái)是到最后測(cè)試到test組存在后又回溯了,此解決方案不可行。 

然后又試了(.(?!abc))*(找出所有后面不是abc的字符),結(jié)果是"abc","abcd"通過(guò)測(cè)試,"aabc"則只截取了后面的"abc",顯然不行。 

那加強(qiáng)條件試試:((?<!abc).(?!abc))*(找出所有前面和后面都不是abc的字符),結(jié)果是所有包含abc的字符串都只截取了里面的"abc",不包含abc的則直接通過(guò)。 

現(xiàn)在看來(lái)有點(diǎn)戲了,但是怎么把那些內(nèi)部包含abc的字符串過(guò)濾掉呢?這個(gè)問(wèn)題換句話說(shuō)也就是怎么匹配整體而不是部分呢?現(xiàn)在需要明確用戶的需求了:如果用戶想要找的是單詞,那就在表達(dá)式的兩端加上\b,如果要找的是行,就加上^和$。由于用戶的問(wèn)題沒(méi)有明確說(shuō)明,我就當(dāng)作是單詞吧。 

于是等到了這樣的表達(dá)式:\b((?<!abc).(?!abc))*\b,經(jīng)過(guò)測(cè)試,這個(gè)表達(dá)式能匹配所有不包含abc的單詞,以及單詞abc。 

怎么排除單詞abc?經(jīng)過(guò)一番思考,最后我認(rèn)為判斷單詞是否以a開(kāi)頭的方式最為方便:\b(a(?!bc)|[^a](?!abc))((?<!abc).(?!abc))*\b(要么以后面不是bc的a開(kāi)頭,要么不以a開(kāi)頭,除了開(kāi)頭后面所有的字符必須前面和后面都不是abc)。經(jīng)過(guò)測(cè)試,完全滿足要求,Bingo! 

使用正則表達(dá)式查找不包含連續(xù)字符串a(chǎn)bc的單詞,最終結(jié)果:\b(a(?!bc)|[^a](?!abc))((?<!abc).(?!abc))*\b 
---------------- 

更新:根據(jù)maple的評(píng)論,更簡(jiǎn)潔的作法是:\b((?!abc)\w)+\b 

經(jīng)常我們會(huì)遇到想找出不包含某個(gè)字符串的文本,程序員最容易想到的是在正則表達(dá)式里使用,^(hede)來(lái)過(guò)濾”hede”字串,但這種寫(xiě)法是錯(cuò)誤的。我們可以這樣寫(xiě):[^hede],但這樣的正則表達(dá)式完全是另外一個(gè)意思,它的意思是字符串里不能包含‘h',‘e',‘d'三個(gè)但字符。那什么樣的正則表達(dá)式能過(guò)濾出不包含完整“hello”字串的信息呢?

事實(shí)上,說(shuō)正則表達(dá)式里不支持逆向匹配并不是百分之百的正確。就像這個(gè)問(wèn)題,我們就可以使用否定式查找來(lái)模擬出逆向匹配,從而解決我們的問(wèn)題:

^((?!hede).)*$

上面這個(gè)表達(dá)式就能過(guò)濾出不包含‘hede'字串的信息。我上面也說(shuō)了,這種寫(xiě)法并不是正則表達(dá)式“擅長(zhǎng)”的用法,但它是可以這樣用的。

 

解釋

一個(gè)字符串是由n個(gè)字符組成的。在每個(gè)字符之前和之后,都有一個(gè)空字符。這樣,一個(gè)由n個(gè)字符組成的字符串就有n+1個(gè)空字符串。我們來(lái)看一下“ABhedeCD”這個(gè)字符串:

所有的e編號(hào)的位置都是空字符。表達(dá)式(?!hede).會(huì)往前查找,看看前面是不是沒(méi)有“hede”字串,如果沒(méi)有(是其它字符),那么.(點(diǎn)號(hào))就會(huì)匹配這些其它字符。這種正則表達(dá)式的“查找”也叫做“zero-width-assertions”(零寬度斷言),因?yàn)樗粫?huì)捕獲任何的字符,只是判斷。

在上面的例子里,每個(gè)空字符都會(huì)檢查其前面的字符串是否不是‘hede',如果不是,這.(點(diǎn)號(hào))就是匹配捕捉這個(gè)字符。表達(dá)式(?!hede).只執(zhí)行一次,所以,我們將這個(gè)表達(dá)式用括號(hào)包裹成組(group),然后用*(星號(hào))修飾——匹配0次或多次:

((?!hede).)*。

你可以理解,正則表達(dá)式((?!hede).)*匹配字符串"ABhedeCD"的結(jié)果false,因?yàn)樵趀3位置,(?!hede)匹配不合格,它之前有"hede"字符串,也就是包含了指定的字符串。

 

在正則表達(dá)式里, ?! 是否定式向前查找,它幫我們解決了字符串“不包含”匹配的問(wèn)題。

以下是一些補(bǔ)充:

分享下php生成隨機(jī)數(shù)的三種方法,生成1-10之間的不重復(fù)隨機(jī)數(shù),php生成不重復(fù)隨機(jī)數(shù)的例子,需要的朋友參考下。

在hacker news上看到regex golf,幾道很有趣的正則表達(dá)式的題,有的需要用到不匹配這種匹配,比如需要匹配不包含某個(gè)單詞的串。

開(kāi)始正題之前,先來(lái)看看正則表達(dá)式的語(yǔ)法:

[abc] a或b或c . 任意單個(gè)字符 a? 零個(gè)或一個(gè)a [^abc] 任意不是abc的字符 \s 空格 a* 零個(gè)或多個(gè)a [a-z] a-z的任意字符 \S 非空格 a+ 一個(gè)或多個(gè)a [a-zA-Z] a-z或A-Z \d 任意數(shù)字 a{n} 正好出現(xiàn)n次a ^ 一行開(kāi)頭 \D 任意非數(shù)字 a{n,} 至少出現(xiàn)n次a $ 一行末尾 \w 任意字母數(shù)字或下劃線 a{n,m} 出現(xiàn)n-m次a (...) 括號(hào)用于分組 \W 任意非字母數(shù)字或下劃線 a*? 零個(gè)或多個(gè)a(非貪婪) (a|b) a或b \b 單詞邊界 (a)...\1 引用分組 (?=a) 前面有a (?!a) 前面沒(méi)有a \B 非單詞邊界

正則表達(dá)式中有(?=a)和(?!a)來(lái)表示我們是否需要匹配某個(gè)東西。

所以,有需要不匹配某樣內(nèi)容時(shí),就可以用(?!a)了。比如要匹配不含hello的字符串就可以這樣寫(xiě)。

 


^(?!.*hello)

 

這里.*用來(lái)表示hello之前可能有其他的字符,為什么還要加^呢,因?yàn)槿绻患拥脑?,可能匹配到h之后的這個(gè)位置上了。

現(xiàn)在就可以解決regex golf上的abba這道題了。 這道題是去匹配不含abba這種形式的單詞,比如abba,anallagmatic就不應(yīng)該匹配上。

正則表達(dá)式代碼:

 


^(?!.*(.)(.)\2\1)

 

然后利用不匹配,還可以解決prime這道題,這道題匹配有素?cái)?shù)個(gè)x的串,先看正則。  


^(?!(xx+)\1+$)

 

(xx+)是匹配2個(gè)及2個(gè)以上的x,(xx+)\1+就是匹配重復(fù)出現(xiàn)2個(gè)及以上的串,所以(xx+)\1+就表示了那些非素?cái)?shù)的串,那么素?cái)?shù)串就是除去這些非素?cái)?shù)串,即是以上的正則表達(dá)式了。

PS:關(guān)于正則,本站還提供了2款非常簡(jiǎn)便實(shí)用的正則測(cè)試工具供大家使用:

 

JavaScript正則表達(dá)式在線測(cè)試工具: http://tools.jb51.net/regex/javascript

正則表達(dá)式在線生成工具: http://tools.jb51.net/regex/create_reg

 

如對(duì)本文有疑問(wèn),請(qǐng)?zhí)峤坏浇涣髡搲?,廣大熱心網(wǎng)友會(huì)為你解答??! 點(diǎn)擊進(jìn)入論壇

發(fā)表評(píng)論 (2008人查看0條評(píng)論)
請(qǐng)自覺(jué)遵守互聯(lián)網(wǎng)相關(guān)的政策法規(guī),嚴(yán)禁發(fā)布色情、暴力、反動(dòng)的言論。
昵稱:
最新評(píng)論
------分隔線----------------------------

其它欄目

· 建站教程
· 365學(xué)習(xí)

業(yè)務(wù)咨詢

· 技術(shù)支持
· 服務(wù)時(shí)間:9:00-18:00
365建站網(wǎng)二維碼

Powered by 365建站網(wǎng) RSS地圖 HTML地圖

copyright © 2013-2024 版權(quán)所有 鄂ICP備17013400號(hào)