正則表達式可以:
1、測試字符串的某個模式。例如,可以對一個輸入字符串進行測試,看在該字符串是否存在一個電話號碼模式或一個信用卡號碼模式。這稱為數(shù)據(jù)有效性驗證
2、替換文本??梢栽谖臋n中使用一個正則表達式來標識特定文字,然后可以全部將其刪除,或者替換為別的文字
3、根據(jù)模式匹配從字符串中提取一個子字符串。可以用來在文本或輸入字段中查找特定文字
正則表達式語法
一個正則表達式就是由普通字符(例如字符 a 到 z)以及特殊字符(稱為元字符)組成的文字模式。該模式描述在查找文字主體時待匹配的一個或多個字符串。正則表達式作為一個模板,將某個字符模式與所搜索的字符串進行匹配。
創(chuàng)建正則表達式
var re = new RegExp();//RegExp是一個對象,和Aarray一樣 //但這樣沒有任何效果,需要將正則表達式的內容作為字符串傳遞進去 re =new RegExp("a");//最簡單的正則表達式,將匹配字母a re=new RegExp("a","i");//第二個參數(shù),表示匹配時不分大小寫
RegExp構造函數(shù)第一個參數(shù)為正則表達式的文本內容,而第二個參數(shù)則為可選項標志.標志可以組合使用
?g (全文查找)
?i (忽略大小寫)
?m (多行查找)
var re = new RegExp("a","gi");//匹配所有的a或A
正則表達式還有另一種正則表達式字面量的聲明方式
var re = /a/gi;
正則表達式對象的方法
?test,返回一個 Boolean 值,它指出在被查找的字符串中是否存在模式。如果存在則返回 true,否則就返回 false。
?exec,用正則表達式模式在字符串中運行查找,并返回包<script type="text/javascript" src="http://www.iteye.com/javascripts/tinymce/themes/advanced/langs/zh.js"></script><script type="text/javascript" src="http://www.iteye.com/javascripts/tinymce/plugins/javaeye/langs/zh.js"></script>含該查找結果的一個數(shù)組。
?compile,把正則表達式編譯為內部格式,從而執(zhí)行得更快。
正則表達式對象的屬性
//test方法,測試字符串,符合模式時返回true,否則返回false var re = /he/;//最簡單的正則表達式,將匹配he這個單詞 var str = "he"; alert(re.test(str));//true str = "we"; alert(re.test(str));//false str = "HE"; alert(re.test(str));//false,大寫,如果要大小寫都匹配可以指定i標志(i是ignoreCase或case-insensitive的表示) re = /he/i; alert(re.test(str));//true str = "Certainly!He loves her!"; alert(re.test(str));//true,只要包含he(HE)就符合,如果要只是he或HE,不能有其它字符, 則可使用^和$ re = /^he/i;//脫字符(^)代表字符開始位置 alert(re.test(str));//false,因為he不在str最開始 str = "He is a good boy!"; alert(re.test(str));//true,He是字符開始位置,還需要使用$ re = /^he$/i;//$表示字符結束位置 alert(re.test(str));//false str = "He"; alert(re.test(str));//true //當然,這樣不能發(fā)現(xiàn)正則表達式有多強大,因為我們完全可以在上面的例子中使用==或indexOf re = /s/;// s匹配任何空白字符,包括空格、制表符、換頁符等等 str= "user Name";//用戶名包含空格 alert(re.test(str));//true str = "user Name";//用戶名包含制表符 alert(re.test(str));//true re=/^[a-z]/i;//[]匹配指定范圍內的任意字符,這里將匹配英文字母,不區(qū)分大小寫 str="variableName";//變量名必須以字母開頭 alert(re.test(str));//true str="123abc"; alert(re.test(str));//false
當然,僅僅知道了字符串是否匹配模式還不夠,我們還需要知道哪些字符匹配了模式
var osVersion = "Ubuntu 8";//其中的8表示系統(tǒng)主版本號 var re = /^[a-z]+s+d+$/i; //+號表示字符至少要出現(xiàn)1次,s表示空白字符,d表示一個數(shù)字 alert(re.test(osVersion));//true,但我們想知道主版本號 //另一個方法exec,返回一個數(shù)組,數(shù)組的第一個元素為完整的匹配內容 re=/^[a-z]+s+d+$/i; arr = re.exec(osVersion); alert(arr[0]);//將osVersion完整輸出,因為整個字符串剛好匹配re //我只需要取出數(shù)字 re=/d+/; var arr = re.exec(osVersion); alert(arr[0]);//8
更復雜的用法,使用子匹配
//exec返回的數(shù)組第1到n元素中包含的是匹配中出現(xiàn)的任意一個子匹配 re=/^[a-z]+s+(d+)$/i;//用()來創(chuàng)建子匹配 arr =re.exec(osVersion); alert(arr[0]);//整個osVersion,也就是正則表達式的完整匹配 alert(arr[1]);//8,第一個子匹配,事實也可以這樣取出主版本號 a lert(arr.length);//2 osVersion = "Ubuntu 8.10";//取出主版本號和次版本號 re = /^[a-z]+s+(d+).(d+)$/i;//.是正則表達式元字符之一,若要用它的字面意義須轉義 arr = re.exec(osVersion); alert(arr[0]);//完整的osVersion alert(arr[1]);//8 alert(arr[2]);//10
注意,當字符串不匹配re時,exec方法將返回null
String對象的一些和正則表達式有關的方法
//replace方法,用于替換字符串 var str ="some money"; alert(str.replace("some","much"));//much money //replace的第一個參數(shù)可以為正則表達式 var re = /s/;//空白字符 alert(str.replace(re,"%"));//some%money //在不知道字符串中有多少空白字符時,正則表達式極為方便 str ="some some tsometf"; re = /s+/; alert(str.replace(re,"#"));//但這樣只會將第一次出現(xiàn)的一堆空白字符替換掉 //因為一個正則表達式只能進行一次匹配,s+匹配了第一個空格后就退出了 re = /s+/g;//g,全局標志,將使正則表達式匹配整個字符串 alert(str.replace(re,"@"));//some@some@some@ //另一個與之相似的是split var str = "a-bd-c"; var arr = str.split("-");//返回["a","bd","c"] //如果str是用戶輸入的,他可能輸入a-bd-c也可能輸入a bd c或a_bd_c,但不會是abdc(這樣就說他輸錯了) str = "a_db-c";//用戶以他喜歡的方式加分隔符s re=/[^a-z]/i;//前面我們說^表示字符開始,但在[]里它表示一個負字符集 //匹配任何不在指定范圍內的任意字符,這里將匹配除字母處的所有字符 arr = str.split(re);//仍返回["a","bd","c"]; //在字符串中查找時我們常用indexOf,與之對應用于正則查找的方法是search str = "My age is 18.Golden age!";//年齡不是一定的,我們用indexOf不能查找它的位置 re = /d+/; alert(str.search(re));//返回查找到的字符串開始下標10 //注意,因為查找本身就是出現(xiàn)第一次就立即返回,所以無需在search時使用g標志 //下面的代碼雖然不出錯,但g標志是多余的 re=/d+/g; alert(str.search(re));//仍然是10
注意,當search方法沒有找到匹配時,將返回-1
類似于exec方法,String對象的match方法也用于將字符串與正則表達式進行匹配并返回結果數(shù)組
var str = "My name is CJ.Hello everyone!"; var re = /[A-Z]/;//匹配所有大寫字母 var arr = str.match(re);//返回數(shù)組 alert(arr);//數(shù)組中只會包含一個M,因為我們沒有使用全局匹配 re = /[A-Z]/g; arr = str.match(re); alert(arr);//M,C,J,H //從字符串中抽取單詞 re = /b[a-z]*b/gi;//b表示單詞邊界 str = "one two three four"; alert(str.match(re));//one,two,three,four
RegExp對象實例的一些屬性
var re = /[a-z]/i; alert(re.source);//將[a-z]字符串輸出 //請注意,直接alert(re)會將正則表達式連同前向斜線與標志輸出,這是re.toString方法定義的
每個RegExp對象的實例具有l(wèi)astIndex屬性,它是被查找字符串中下一次成功匹配的開始位置,默認值是-1。 lastIndex 屬性被 RegExp 對象的 exec 和 test 方法修改.并且它是可寫的.
var re = /[A-Z]/; //exec方法執(zhí)行后,修改了re的lastIndex屬性, var str = "Hello,World!!!"; var arr = re.exec(str); alert(re.lastIndex);//0,因為沒有設置全局標志 re = /[A-Z]/g; arr = re.exec(str); alert(re.lastIndex);//1 arr = re.exec(str); alert(re.lastIndex);//7
當匹配失?。ê竺鏇]有匹配),或lastIndex值大于字符串長度時,再執(zhí)行exec等方法會將lastIndex設為0(開始位置)
var re = /[A-Z]/; var str = "Hello,World!!!"; re.lastIndex = 120; var arr = re.exec(str); alert(re.lastIndex);//0
RegExp對象的靜態(tài)屬性
//input 最后用于匹配的字符串(傳遞給test,exec方法的字符串) var re = /[A-Z]/; var str = "Hello,World!!!"; var arr = re.exec(str); alert(RegExp.input);//Hello,World!!! re.exec("tempstr"); alert(RegExp.input);//仍然是Hello,World!!!,因為tempstr不匹配 //lastMatch 最后匹配的字符 re = /[a-z]/g; str = "hi"; re.test(str); alert(RegExp.lastMatch);//h re.test(str); alert(RegExp["$&"]);//i $&是lastMatch的短名字,但由于它不是合法變量名,所以要。。 //lastParen 最后匹配的分組 re = /[a-z](d+)/gi; str = "Class1 Class2 Class3"; re.test(str); alert(RegExp.lastParen);//1 re.test(str); alert(RegExp["$+"]);//2 //leftContext 返回被查找的字符串中從字符串開始位置到最后匹配之前的位置之間的字符 //rigthContext 返回被搜索的字符串中從最后一個匹配位置開始到字符串結尾之間的字符 re = /[A-Z]/g; str = "123ABC456"; re.test(str); alert(RegExp.leftContext);//123 alert(RegExp.rightContext);//BC456 re.test(str); alert(RegExp["$`"]);//123A alert(RegExp["$'"]);//C456
multiline屬性返回正則表達式是否使用多行模式,這個屬性不針對某個正則表達式實例,而是針對所有正則表達式,并且這個屬性可寫.(IE與Opera不支持這個屬性)
alert(RegExp.multiline); //因為IE,Opera不支持這個屬性,所以最好還是單獨指定 var re = /w+/m; alert(re.multiline); alert(RegExp["$*"]);//RegExp對象的靜態(tài)屬性不會因為給RegExp某個對象實例指定了m標志而改變 RegExp.multiline = true;//這將打開所有正則表達式實例的多行匹配模式 alert(RegExp.multiline);
使用元字符注意事項:元字符是正則表達式的一部分,當我們要匹配正則表達式本身時,必須對這些元字符轉義.下面是正則表達式用到的所有元字符
( [ { ^ $ | ) ? * + .
var str = "?"; var re = /?/; alert(re.test(str));//出錯,因為?是元字符,必須轉義 re = /?/; alert(re.test(str));//true
使用RegExp構造函數(shù)與使用正則表達式字面量創(chuàng)建正則表達式注意點
var str = "?"; alert(str);//只會輸出? var re = /?/;//將匹配? alert(re.test(str));//true re = new RegExp("?");//出錯,因為這相當于re = /?/ re = new RegExp("\?");//正確,將匹配? alert(re.test(str));//true
既然雙重轉義這么不友好,所以還是用正則表達式字面量的聲明方式
如何在正則表達式中使用特殊字符?
//ASCII方式用十六進制數(shù)來表示特殊字符 var re = /^x43x4A$/;//將匹配CJ alert(re.test("CJ"));//true //也可使用八進制方式 re = /^103112$/;//將匹配CJ alert(re.test("CJ"));//true //還可以使用Unicode編碼 re =/^u0043u004A$/;//使用 Unicode,必須使用u開頭,接著是字符編碼的四位16進制表現(xiàn)形式 alert(re.test("CJ"));
另處,還有一些其它的預定義特殊字符,如下表所示:
字符 描述
n 換行符
r 回車符
t 制表符
f 換頁符(Tab)
cX 與X對應的控制字符
b 退格符(BackSpace)
v 垂直制表符