正則表達(dá)式可以:
1、測(cè)試字符串的某個(gè)模式。例如,可以對(duì)一個(gè)輸入字符串進(jìn)行測(cè)試,看在該字符串是否存在一個(gè)電話號(hào)碼模式或一個(gè)信用卡號(hào)碼模式。這稱(chēng)為數(shù)據(jù)有效性驗(yàn)證
2、替換文本??梢栽谖臋n中使用一個(gè)正則表達(dá)式來(lái)標(biāo)識(shí)特定文字,然后可以全部將其刪除,或者替換為別的文字
3、根據(jù)模式匹配從字符串中提取一個(gè)子字符串??梢杂脕?lái)在文本或輸入字段中查找特定文字
正則表達(dá)式語(yǔ)法
一個(gè)正則表達(dá)式就是由普通字符(例如字符 a 到 z)以及特殊字符(稱(chēng)為元字符)組成的文字模式。該模式描述在查找文字主體時(shí)待匹配的一個(gè)或多個(gè)字符串。正則表達(dá)式作為一個(gè)模板,將某個(gè)字符模式與所搜索的字符串進(jìn)行匹配。
創(chuàng)建正則表達(dá)式
var re = new RegExp();//RegExp是一個(gè)對(duì)象,和Aarray一樣 //但這樣沒(méi)有任何效果,需要將正則表達(dá)式的內(nèi)容作為字符串傳遞進(jìn)去 re =new RegExp("a");//最簡(jiǎn)單的正則表達(dá)式,將匹配字母a re=new RegExp("a","i");//第二個(gè)參數(shù),表示匹配時(shí)不分大小寫(xiě)
RegExp構(gòu)造函數(shù)第一個(gè)參數(shù)為正則表達(dá)式的文本內(nèi)容,而第二個(gè)參數(shù)則為可選項(xiàng)標(biāo)志.標(biāo)志可以組合使用
?g (全文查找)
?i (忽略大小寫(xiě))
?m (多行查找)
var re = new RegExp("a","gi");//匹配所有的a或A
正則表達(dá)式還有另一種正則表達(dá)式字面量的聲明方式
var re = /a/gi;
正則表達(dá)式對(duì)象的方法
?test,返回一個(gè) Boolean 值,它指出在被查找的字符串中是否存在模式。如果存在則返回 true,否則就返回 false。
?exec,用正則表達(dá)式模式在字符串中運(yùn)行查找,并返回包<script type="text/javascript" src="http://www.iteye.com/javascripts/tinymce/themes/advanced/langs/zh.js"></script><script type="text/javascript" src="http://www.iteye.com/javascripts/tinymce/plugins/javaeye/langs/zh.js"></script>含該查找結(jié)果的一個(gè)數(shù)組。
?compile,把正則表達(dá)式編譯為內(nèi)部格式,從而執(zhí)行得更快。
正則表達(dá)式對(duì)象的屬性
//test方法,測(cè)試字符串,符合模式時(shí)返回true,否則返回false var re = /he/;//最簡(jiǎn)單的正則表達(dá)式,將匹配he這個(gè)單詞 var str = "he"; alert(re.test(str));//true str = "we"; alert(re.test(str));//false str = "HE"; alert(re.test(str));//false,大寫(xiě),如果要大小寫(xiě)都匹配可以指定i標(biāo)志(i是ignoreCase或case-insensitive的表示) re = /he/i; alert(re.test(str));//true str = "Certainly!He loves her!"; alert(re.test(str));//true,只要包含he(HE)就符合,如果要只是he或HE,不能有其它字符, 則可使用^和$ re = /^he/i;//脫字符(^)代表字符開(kāi)始位置 alert(re.test(str));//false,因?yàn)閔e不在str最開(kāi)始 str = "He is a good boy!"; alert(re.test(str));//true,He是字符開(kāi)始位置,還需要使用$ re = /^he$/i;//$表示字符結(jié)束位置 alert(re.test(str));//false str = "He"; alert(re.test(str));//true //當(dāng)然,這樣不能發(fā)現(xiàn)正則表達(dá)式有多強(qiáng)大,因?yàn)槲覀兺耆梢栽谏厦娴睦又惺褂?=或indexOf re = /s/;// s匹配任何空白字符,包括空格、制表符、換頁(yè)符等等 str= "user Name";//用戶(hù)名包含空格 alert(re.test(str));//true str = "user Name";//用戶(hù)名包含制表符 alert(re.test(str));//true re=/^[a-z]/i;//[]匹配指定范圍內(nèi)的任意字符,這里將匹配英文字母,不區(qū)分大小寫(xiě) str="variableName";//變量名必須以字母開(kāi)頭 alert(re.test(str));//true str="123abc"; alert(re.test(str));//false
當(dāng)然,僅僅知道了字符串是否匹配模式還不夠,我們還需要知道哪些字符匹配了模式
var osVersion = "Ubuntu 8";//其中的8表示系統(tǒng)主版本號(hào) var re = /^[a-z]+s+d+$/i; //+號(hào)表示字符至少要出現(xiàn)1次,s表示空白字符,d表示一個(gè)數(shù)字 alert(re.test(osVersion));//true,但我們想知道主版本號(hào) //另一個(gè)方法exec,返回一個(gè)數(shù)組,數(shù)組的第一個(gè)元素為完整的匹配內(nèi)容 re=/^[a-z]+s+d+$/i; arr = re.exec(osVersion); alert(arr[0]);//將osVersion完整輸出,因?yàn)檎麄€(gè)字符串剛好匹配re //我只需要取出數(shù)字 re=/d+/; var arr = re.exec(osVersion); alert(arr[0]);//8
更復(fù)雜的用法,使用子匹配
//exec返回的數(shù)組第1到n元素中包含的是匹配中出現(xiàn)的任意一個(gè)子匹配 re=/^[a-z]+s+(d+)$/i;//用()來(lái)創(chuàng)建子匹配 arr =re.exec(osVersion); alert(arr[0]);//整個(gè)osVersion,也就是正則表達(dá)式的完整匹配 alert(arr[1]);//8,第一個(gè)子匹配,事實(shí)也可以這樣取出主版本號(hào) a lert(arr.length);//2 osVersion = "Ubuntu 8.10";//取出主版本號(hào)和次版本號(hào) re = /^[a-z]+s+(d+).(d+)$/i;//.是正則表達(dá)式元字符之一,若要用它的字面意義須轉(zhuǎn)義 arr = re.exec(osVersion); alert(arr[0]);//完整的osVersion alert(arr[1]);//8 alert(arr[2]);//10
注意,當(dāng)字符串不匹配re時(shí),exec方法將返回null
String對(duì)象的一些和正則表達(dá)式有關(guān)的方法
//replace方法,用于替換字符串 var str ="some money"; alert(str.replace("some","much"));//much money //replace的第一個(gè)參數(shù)可以為正則表達(dá)式 var re = /s/;//空白字符 alert(str.replace(re,"%"));//some%money //在不知道字符串中有多少空白字符時(shí),正則表達(dá)式極為方便 str ="some some tsometf"; re = /s+/; alert(str.replace(re,"#"));//但這樣只會(huì)將第一次出現(xiàn)的一堆空白字符替換掉 //因?yàn)橐粋€(gè)正則表達(dá)式只能進(jìn)行一次匹配,s+匹配了第一個(gè)空格后就退出了 re = /s+/g;//g,全局標(biāo)志,將使正則表達(dá)式匹配整個(gè)字符串 alert(str.replace(re,"@"));//some@some@some@ //另一個(gè)與之相似的是split var str = "a-bd-c"; var arr = str.split("-");//返回["a","bd","c"] //如果str是用戶(hù)輸入的,他可能輸入a-bd-c也可能輸入a bd c或a_bd_c,但不會(huì)是abdc(這樣就說(shuō)他輸錯(cuò)了) str = "a_db-c";//用戶(hù)以他喜歡的方式加分隔符s re=/[^a-z]/i;//前面我們說(shuō)^表示字符開(kāi)始,但在[]里它表示一個(gè)負(fù)字符集 //匹配任何不在指定范圍內(nèi)的任意字符,這里將匹配除字母處的所有字符 arr = str.split(re);//仍返回["a","bd","c"]; //在字符串中查找時(shí)我們常用indexOf,與之對(duì)應(yīng)用于正則查找的方法是search str = "My age is 18.Golden age!";//年齡不是一定的,我們用indexOf不能查找它的位置 re = /d+/; alert(str.search(re));//返回查找到的字符串開(kāi)始下標(biāo)10 //注意,因?yàn)椴檎冶旧砭褪浅霈F(xiàn)第一次就立即返回,所以無(wú)需在search時(shí)使用g標(biāo)志 //下面的代碼雖然不出錯(cuò),但g標(biāo)志是多余的 re=/d+/g; alert(str.search(re));//仍然是10
注意,當(dāng)search方法沒(méi)有找到匹配時(shí),將返回-1
類(lèi)似于exec方法,String對(duì)象的match方法也用于將字符串與正則表達(dá)式進(jìn)行匹配并返回結(jié)果數(shù)組
var str = "My name is CJ.Hello everyone!"; var re = /[A-Z]/;//匹配所有大寫(xiě)字母 var arr = str.match(re);//返回?cái)?shù)組 alert(arr);//數(shù)組中只會(huì)包含一個(gè)M,因?yàn)槲覀儧](méi)有使用全局匹配 re = /[A-Z]/g; arr = str.match(re); alert(arr);//M,C,J,H //從字符串中抽取單詞 re = /b[a-z]*b/gi;//b表示單詞邊界 str = "one two three four"; alert(str.match(re));//one,two,three,four
RegExp對(duì)象實(shí)例的一些屬性
var re = /[a-z]/i; alert(re.source);//將[a-z]字符串輸出 //請(qǐng)注意,直接alert(re)會(huì)將正則表達(dá)式連同前向斜線與標(biāo)志輸出,這是re.toString方法定義的
每個(gè)RegExp對(duì)象的實(shí)例具有l(wèi)astIndex屬性,它是被查找字符串中下一次成功匹配的開(kāi)始位置,默認(rèn)值是-1。 lastIndex 屬性被 RegExp 對(duì)象的 exec 和 test 方法修改.并且它是可寫(xiě)的.
var re = /[A-Z]/; //exec方法執(zhí)行后,修改了re的lastIndex屬性, var str = "Hello,World!!!"; var arr = re.exec(str); alert(re.lastIndex);//0,因?yàn)闆](méi)有設(shè)置全局標(biāo)志 re = /[A-Z]/g; arr = re.exec(str); alert(re.lastIndex);//1 arr = re.exec(str); alert(re.lastIndex);//7
當(dāng)匹配失?。ê竺鏇](méi)有匹配),或lastIndex值大于字符串長(zhǎng)度時(shí),再執(zhí)行exec等方法會(huì)將lastIndex設(shè)為0(開(kāi)始位置)
var re = /[A-Z]/; var str = "Hello,World!!!"; re.lastIndex = 120; var arr = re.exec(str); alert(re.lastIndex);//0
RegExp對(duì)象的靜態(tài)屬性
//input 最后用于匹配的字符串(傳遞給test,exec方法的字符串) var re = /[A-Z]/; var str = "Hello,World!!!"; var arr = re.exec(str); alert(RegExp.input);//Hello,World!!! re.exec("tempstr"); alert(RegExp.input);//仍然是Hello,World!!!,因?yàn)閠empstr不匹配 //lastMatch 最后匹配的字符 re = /[a-z]/g; str = "hi"; re.test(str); alert(RegExp.lastMatch);//h re.test(str); alert(RegExp["$&"]);//i $&是lastMatch的短名字,但由于它不是合法變量名,所以要。。 //lastParen 最后匹配的分組 re = /[a-z](d+)/gi; str = "Class1 Class2 Class3"; re.test(str); alert(RegExp.lastParen);//1 re.test(str); alert(RegExp["$+"]);//2 //leftContext 返回被查找的字符串中從字符串開(kāi)始位置到最后匹配之前的位置之間的字符 //rigthContext 返回被搜索的字符串中從最后一個(gè)匹配位置開(kāi)始到字符串結(jié)尾之間的字符 re = /[A-Z]/g; str = "123ABC456"; re.test(str); alert(RegExp.leftContext);//123 alert(RegExp.rightContext);//BC456 re.test(str); alert(RegExp["$`"]);//123A alert(RegExp["$'"]);//C456
multiline屬性返回正則表達(dá)式是否使用多行模式,這個(gè)屬性不針對(duì)某個(gè)正則表達(dá)式實(shí)例,而是針對(duì)所有正則表達(dá)式,并且這個(gè)屬性可寫(xiě).(IE與Opera不支持這個(gè)屬性)
alert(RegExp.multiline); //因?yàn)镮E,Opera不支持這個(gè)屬性,所以最好還是單獨(dú)指定 var re = /w+/m; alert(re.multiline); alert(RegExp["$*"]);//RegExp對(duì)象的靜態(tài)屬性不會(huì)因?yàn)榻oRegExp某個(gè)對(duì)象實(shí)例指定了m標(biāo)志而改變 RegExp.multiline = true;//這將打開(kāi)所有正則表達(dá)式實(shí)例的多行匹配模式 alert(RegExp.multiline);
使用元字符注意事項(xiàng):元字符是正則表達(dá)式的一部分,當(dāng)我們要匹配正則表達(dá)式本身時(shí),必須對(duì)這些元字符轉(zhuǎn)義.下面是正則表達(dá)式用到的所有元字符
( [ { ^ $ | ) ? * + .
var str = "?"; var re = /?/; alert(re.test(str));//出錯(cuò),因?yàn)??是元字符,必須轉(zhuǎn)義 re = /?/; alert(re.test(str));//true
使用RegExp構(gòu)造函數(shù)與使用正則表達(dá)式字面量創(chuàng)建正則表達(dá)式注意點(diǎn)
var str = "?"; alert(str);//只會(huì)輸出? var re = /?/;//將匹配? alert(re.test(str));//true re = new RegExp("?");//出錯(cuò),因?yàn)檫@相當(dāng)于re = /?/ re = new RegExp("\?");//正確,將匹配? alert(re.test(str));//true
既然雙重轉(zhuǎn)義這么不友好,所以還是用正則表達(dá)式字面量的聲明方式
如何在正則表達(dá)式中使用特殊字符?
//ASCII方式用十六進(jìn)制數(shù)來(lái)表示特殊字符 var re = /^x43x4A$/;//將匹配CJ alert(re.test("CJ"));//true //也可使用八進(jìn)制方式 re = /^103112$/;//將匹配CJ alert(re.test("CJ"));//true //還可以使用Unicode編碼 re =/^u0043u004A$/;//使用 Unicode,必須使用u開(kāi)頭,接著是字符編碼的四位16進(jìn)制表現(xiàn)形式 alert(re.test("CJ"));
另處,還有一些其它的預(yù)定義特殊字符,如下表所示:
字符 描述
n 換行符
r 回車(chē)符
t 制表符
f 換頁(yè)符(Tab)
cX 與X對(duì)應(yīng)的控制字符
b 退格符(BackSpace)
v 垂直制表符