久久久久久久视色,久久电影免费精品,中文亚洲欧美乱码在线观看,在线免费播放AV片

<center id="vfaef"><input id="vfaef"><table id="vfaef"></table></input></center>

<p id="vfaef"><kbd id="vfaef"></kbd></p>

<pre id="vfaef"><u id="vfaef"></u></pre>

<thead id="vfaef"><input id="vfaef"></input></thead>

<pre id="trqkl"></pre>

<td id="trqkl"><strong id="trqkl"></strong></td>

當(dāng)前位置：站長資訊網(wǎng) > 編程知識 > 正文

正則表達(dá)式之回溯

2018-10-29 分類：編程知識閱讀(698) 評論(0)

關(guān)于“回溯”我也是第一次接觸，對它也不算很了解。下面就把我所了解的做為一個心德記錄下來，以備查看。

我們所使用的正則表達(dá)式的匹配基礎(chǔ)大概分為：優(yōu)先選擇最左端（最靠開頭）的匹配結(jié)果和標(biāo)準(zhǔn)的匹配量詞（*、+、？和{m, n}）是匹配優(yōu)先的。

“優(yōu)先選擇最左端的匹配”顧名思義就是從字符串的起始位置開始匹配直到匹配結(jié)束這是基礎(chǔ)；“標(biāo)準(zhǔn)匹配量詞”又分為“非確定型有窮自動機(jī)（NFA）”也可以叫做“表達(dá)式主導(dǎo)”；另外一種是“確定型有窮自動機(jī)（DFA）”也可以叫做“文本主導(dǎo)”。我們目前在JavaScript中所使用的正則表達(dá)式為“表達(dá)式主導(dǎo)”。表達(dá)式主導(dǎo)和文本主導(dǎo)解釋起來有些麻煩，先看來一個例子可能會清楚些。

復(fù)制代碼代碼如下:

// 使用正則表達(dá)式匹配文本
var reg = /to(nite|knight|night)/;
var str = ‘doing tonight’;
reg.test(str);

在上面的這個例子中，第一個元素[t]，它將會重復(fù)嘗試，直到目標(biāo)字符串中找到‘t’為止。之后，就檢查緊隨其后的字符是否能由[o]匹配，如果能，就檢查下面的元素（nite|knight|night）。它的真正含義是“nite”或者“knight”或者“night”。引擎會依次嘗試這3種可能。嘗試[nite]的過程是先嘗試[n]，然后[i]，然后[t]，最后是[e]。如果這種嘗試失敗，引擎會嘗試另一種可能，如此繼續(xù)下去，直到匹配成功或是報(bào)告失敗。表達(dá)式中的控制權(quán)在不同的元素之間轉(zhuǎn)換，所以稱為“表達(dá)式主導(dǎo)”。

同樣是上面的例子“文本主導(dǎo)”在掃描字符串時，會記錄當(dāng)前有效的所有匹配可。當(dāng)引擎移動到t時，它會在當(dāng)前處理的匹配可能中添加一個潛在的可能：

字符串中的位置	正則表達(dá)中的位置
……doing tonight	可能的匹配位置：/t↑o(nite\|knight\|nigth)/

接下來掃描的每個字符，都會更新當(dāng)前的可能匹配序列。繼續(xù)掃描兩個字符以后的情況是：

字符串中的位置	正則表達(dá)中的位置
……doing tonight	可能的匹配位置：/to(ni↑te\|knight\|ni↑gth)/

有效的可能匹配變?yōu)閮蓚€（knight被淘汰出局）。掃描到g時，就只剩下一個可能匹配了。當(dāng)h和t匹配完成后，引擎發(fā)現(xiàn)匹配已經(jīng)完成，報(bào)告成功?！拔谋局鲗?dǎo)”是因?yàn)樗鼟呙璧淖址械拿總€字符都對引擎進(jìn)行了控制。

如果想要弄明白“表達(dá)式主導(dǎo)”是如何工作的，那就要看一下我們今天的主題“回溯（backtracking）”?；厮菥拖袷窃谧卟砺房?，當(dāng)遇到岔路的時候就先在每個路口做一個標(biāo)記。如果走了死路，就可以照原路返回，直到遇見之前所做過的標(biāo)記，標(biāo)記著還未嘗試過的道路。如果那條路也走不能，可以繼續(xù)返回，找到下一個標(biāo)記，如此重復(fù)，直到找到出路，或者直到完成所有沒有嘗試過的路。

在許多情況下，正則引擎必須在兩個（或更多）選項(xiàng)中做出選擇。當(dāng)遇到/……x?……/時，引擎必須是否嘗試匹配X。對于/……X+……/的情況，毫無疑問，X至少嘗試匹配一次――因?yàn)榧犹栆蟊仨毱ヅ渲辽僖淮?。第一個X匹配之后，此要求已經(jīng)滿足，需要決定是否嘗試下一個X。如果決定進(jìn)行，還要決定是否匹配第三個X，第四個X，如此繼續(xù)。每次選擇，其實(shí)就是做一個標(biāo)記，用于提示此處還有另一個可能的選擇，保留起來以備用。在回溯的過程中要考慮兩個要點(diǎn)：哪個分支應(yīng)當(dāng)首先選擇？回溯的時候使用的是哪個（或者是哪些個）之前保存的分支？

第一個問題是按下面這條重要原則來選擇的：

如果需要在“進(jìn)行嘗試”和“路過嘗試”之間選擇，對于匹配優(yōu)先量詞，引擎會優(yōu)先選擇“進(jìn)行嘗試”，而對于忽略優(yōu)先量詞，會選擇“路過嘗試”。

第二個問題是按以下這條原則：

距離當(dāng)前最近儲存的選項(xiàng)就是當(dāng)本地失敗強(qiáng)制回溯時返回的。使用的原則是LIFO（last in first out，后進(jìn)先出）。

我們先來看幾個在道路中做標(biāo)記的例子：

1、未進(jìn)行回溯的匹配

用[ab?c]來匹配“abc”。[a]匹配之后，匹配的當(dāng)前狀態(tài)如下：

“a↑bc”

a↑b?c

現(xiàn)在輪到[b?]了，正則引擎需要決定：是需要嘗試[b]呢，還是跳過？因?yàn)閇？]是匹配優(yōu)先的，它會嘗試匹配。但是，為了確保在這個嘗試最終失敗之后能夠恢復(fù)，引擎會把：

“a↑bc”

ab?↑c

添加到備用狀態(tài)序列中。也就是說，稍后引擎可能從下面的位置繼續(xù)匹配：從正則表達(dá)式中的[b?]之后，字符串的c之前（也就是說當(dāng)前的位置）匹配。這實(shí)際上就是跳過[b]的匹配，而問題容許這樣做。引擎做好標(biāo)記后，就會繼續(xù)向前檢查[b]。在示例中，它能夠匹配，所以新的當(dāng)前狀態(tài)變?yōu)椋?

“ab↑c”

ab?↑c

最終的[c]也能成功匹配，所以整個匹配完成。備用狀態(tài)不再需要了，所以不再保存它們。

2、進(jìn)行了回溯的匹配

下面要匹配的文本是“ac”，在嘗試[b]之前，一切都與之前的過程相同。顯然，這次[b]無法匹配。也就是說，對[……？]進(jìn)行嘗試的路走不通了。因?yàn)橛幸粋€備用狀態(tài)，這個“局部匹配失敗”產(chǎn)工會導(dǎo)致整體匹配失敗。引擎會進(jìn)行回溯，也就是說，把“當(dāng)前狀態(tài)”切換為最近保存的狀態(tài)。

“a↑c”

ab?↑c

在[b]嘗試之前保存的尚未嘗試的選項(xiàng)。這時候，[c]可以匹配c，所以整個匹配宣告完成。

3、不成功的匹配

現(xiàn)在要匹配的文本是“abx”。在嘗試[b]以前，因?yàn)榇嬖趩柼?，保存了這個備用狀態(tài)：

“a↑bx”

ab?↑c

[b]能夠匹配，但這條路往下卻走不通了，因?yàn)閇c]無法匹配x。于是引擎會回溯到之前的狀態(tài)，“交還”b給[c]來匹配。顯然，這次測試也失敗了。如果還有其他保存的狀態(tài)，回溯會繼續(xù)進(jìn)行，但是此時不存在其他狀態(tài)，在字符串中當(dāng)前位置開始的整個匹配也就宣告失敗。

目前對正則表達(dá)式的回溯只能理解這么多，以后我再慢慢補(bǔ)充吧！

贊(0)

標(biāo)簽：java javaScript 正則表達(dá)式

相關(guān)推薦

網(wǎng)站地圖滬ICP備18035694號-2

滬公網(wǎng)安備31011702889846號