久久久久久久视色,久久电影免费精品,中文亚洲欧美乱码在线观看,在线免费播放AV片

<center id="vfaef"><input id="vfaef"><table id="vfaef"></table></input></center>

    <p id="vfaef"><kbd id="vfaef"></kbd></p>

    
    
    <pre id="vfaef"><u id="vfaef"></u></pre>

      <thead id="vfaef"><input id="vfaef"></input></thead>

    1. 站長(zhǎng)資訊網(wǎng)
      最全最豐富的資訊網(wǎng)站

      正則表達(dá)式性能優(yōu)化方法(高效正則表達(dá)式書(shū)寫(xiě))

      這里說(shuō)的正則表達(dá)式優(yōu)化,主要是針對(duì)目前常用的NFA模式正則表達(dá)式,詳細(xì)可以參考:正則表達(dá)式匹配解析過(guò)程探討分析(正則表達(dá)式匹配原理)。從上面例子,我們可以推斷出,影響NFA類(lèi)正則表達(dá)式(常見(jiàn)語(yǔ)言:GNU Emacs,Java,ergp,less,more,.NET語(yǔ)言,
      PCRE library,Perl,PHP,Python,Ruby,sed,vi )其實(shí)主要是它的“回溯”,減少“回溯”次數(shù)(減少循環(huán)查找同一個(gè)字符次數(shù)),是提高性能的主要方法。 我們來(lái)看個(gè)例子:

      源字符串:<script type=”text/javascript”>adsfadfsdasfsdafdsfsadfsa</script>

      匹配要求,匹配<script….>….</script>標(biāo)簽里面所有內(nèi)容,包括改標(biāo)簽

      常見(jiàn)寫(xiě)法(1),因?yàn)?lt;script后面可能出現(xiàn)字符、空白、特殊符號(hào)等,還有標(biāo)簽里面也可能出現(xiàn)各種js代碼。我們簡(jiǎn)單方法是:

      正則表達(dá)式:<script.*?>.*?</script> (測(cè)試工具使用了:regexBuddy)

      正則表達(dá)式性能優(yōu)化方法(高效正則表達(dá)式書(shū)寫(xiě))

      總共花費(fèi)115步,回溯了:48次。 因?yàn)槲覀兪褂谩?”字符,匹配默認(rèn)情況下除了n之外所有字符。
      方法(2),我們分析特點(diǎn)發(fā)現(xiàn),<script…>后面,應(yīng)該是除了”>”之外都可以字符,然后一對(duì)<script>標(biāo)簽里面js內(nèi)容??梢远x為除了”<”之外。(這里面我只是舉例說(shuō)明優(yōu)化方法,實(shí)際網(wǎng)頁(yè)中script標(biāo)簽里面,常見(jiàn)都會(huì)出現(xiàn)有”<”字符了)

      正則表達(dá)式:<script[^?>]+>[^<]+</script>

      正則表達(dá)式性能優(yōu)化方法(高效正則表達(dá)式書(shū)寫(xiě))

      19步,0次回溯! ,步驟只有原先的15%左右,性能幾倍的提升了!
      從上面我們看到,不同正則表達(dá)式,對(duì)通用字符配平,性能相差會(huì)很大。減少“回溯”是最好的方法,減少回溯其中最主要的方法是:”用最小范圍的元字符,盡量避免用過(guò)大的元字符!”。一般規(guī)律如下:

      1、使用正確的邊界匹配器(^、$、b、B等),限定搜索字符串位置
      2、使用具體的元字符、字符類(lèi)(d、w、s等) ,少用”.”字符
      3、使用正確的量詞(+、*、?、{n,m}),如果能夠限定長(zhǎng)度,匹配最佳
      4、使用非捕獲組、原子組,減少?zèng)]有必要的字匹配捕獲用(?:)

      如:我想匹配一些英文字母,它后面接的是數(shù)字。如:abc1234,我可以寫(xiě) “w+d+”,也可以寫(xiě)”[a-zA-Z]+d+” ,其中第一個(gè)w+會(huì)先匹配所有abc1234,然后回溯,匹配滿足d+格式。一共4步,而后面這個(gè)只需要2步,步驟減少一半了!好了,今天就先到這里,歡迎大家討論、交流!

      贊(0)
      分享到: 更多 (0)
      網(wǎng)站地圖   滬ICP備18035694號(hào)-2    滬公網(wǎng)安備31011702889846號(hào)