一個(gè)完整的域名,由根域、頂級(jí)域、二級(jí)、三級(jí)……域名構(gòu)成,每級(jí)域名之間用點(diǎn)分開,每級(jí)域名由字母、數(shù)字和減號(hào)構(gòu)成(第一個(gè)字母不能是減號(hào)),不區(qū)分大小寫,長度不超過63。
單獨(dú)的名字可以由正則表達(dá)式[a-zA-Z0-9][-a-zA-Z0-9]{0,62}來匹配,而完整的域名至少包括兩個(gè)名字(比如google.com,由google和com構(gòu)成),最后可以有一個(gè)表示根域的點(diǎn)(在規(guī)范中,最后有一個(gè)點(diǎn)的才是完整域名,但一般認(rèn)為包括兩個(gè)以上名字的域名也是完整域名,哪怕它后面沒有點(diǎn))。
匹配完整域名的正則表達(dá)式:
一個(gè)IP字串,由四段組成,每一段是0~255的數(shù)字,段與段之間用小數(shù)點(diǎn)隔開,比如61.139.2.69就是一個(gè)合法的IP字串。
如果正則表達(dá)式寫成d{1,3}(.d{1,3}){3}無疑是不負(fù)責(zé)的,因?yàn)樗梢云ヅ?00.400.555.666這樣的非法IP字串。
要匹配一個(gè)0~255之間的數(shù),有幾種匹配方式,下面是其中一種:
匹配 正則表達(dá)式 說明
0~9 d 單個(gè)數(shù)字
10~99 [1-9]d 兩位數(shù)
100~199 1dd 百位為1的三位數(shù)
200~249 2[0-4]d 三位數(shù),百位是2,十位是0~9
250~255 25[0-5] 三位數(shù),百位是2,十位是5,個(gè)位是0~5
寫成正則表達(dá)式,即:(d|([1-9]d)|(1dd)|(2[0-4]d)|(25[0-5])),但是這樣的正則表達(dá)式在匹配254這樣的字串時(shí),會(huì)分別匹配2、5、4,得到3個(gè)匹配,達(dá)不到預(yù)期效果,正確做法是將次序顛倒為((25[0-5])|(2[0-4]d)|(1dd)|([1-9]d)|d),因?yàn)樵?xxx|yyy)這種匹配行為中,是從左向右搜索的。
完整的正則表達(dá)式是:
按:
象061這樣的高位為0的數(shù)是不能被匹配的。
因此,最上面(1. 部分)的寫法才是正確完整版的,(2. 部分)的寫法較為片面