正則表達式可以:
•測試字符串的某個模式。例如,可以對一個輸入字符串進行測試,看在該字符串是否存在一個電話號碼模式或一個信用卡號碼模式。這稱為數(shù)據(jù)有效性驗證
•替換文本??梢栽谖臋n中使用一個正則表達式來標識特定文字,然后可以全部將其刪除,或者替換為別的文字
•根據(jù)模式匹配從字符串中提取一個子字符串??梢杂脕碓谖谋净蜉斎胱侄沃胁檎姨囟ㄎ淖?
正則表達式語法
一個正則表達式就是由普通字符(例如字符 a 到 z)以及特殊字符(稱為元字符)組成的文字模式。該模式描述在查找文字主體時待匹配的一個或多個字符串。正則表達式作為一個模板,將某個字符模式與所搜索的字符串進行匹配。
創(chuàng)建正則表達式
Js代碼
//但這樣沒有任何效果,需要將正則表達式的內容作為字符串傳遞進去
re =new RegExp(“a”);//最簡單的正則表達式,將匹配字母a
re=new RegExp(“a”,”i”);//第二個參數(shù),表示匹配時不分大小寫
RegExp構造函數(shù)第一個參數(shù)為正則表達式的文本內容,而第一個參數(shù)則為可選項標志.標志可以組合使用
•g (全文查找)
•i (忽略大小寫)
•m (多行查找)
Js代碼
正則表達式還有另一種正則表達式字面量的聲明方式
Js代碼
和正則表達式相關的方法和屬性
正則表達式對象的方法
•test,返回一個 Boolean 值,它指出在被查找的字符串中是否存在模式。如果存在則返回 true,否則就返回 false。
•exec,用正則表達式模式在字符串中運行查找,并返回包<script type=”text/javascript” src=”http://www.javaeye.com/javascripts/tinymce/themes/advanced/langs/zh.js”></script><script type=”text/javascript” src=”http://www.javaeye.com/javascripts/tinymce/plugins/javaeye/langs/zh.js”></script>含該查找結果的一個數(shù)組。
•compile,把正則表達式編譯為內部格式,從而執(zhí)行得更快。
正則表達式對象的屬性
•source,返回正則表達式模式的文本的復本。只讀。
•lastIndex,返回字符位置,它是被查找字符串中下一次成功匹配的開始位置。
•$1…$9,返回九個在模式匹配期間找到的、最近保存的部分。只讀。
•input ($_),返回執(zhí)行規(guī)范表述查找的字符串。只讀。
•lastMatch ($&),返回任何正則表達式搜索過程中的最后匹配的字符。只讀。
•lastParen ($+),如果有的話,返回任何正則表達式查找過程中最后括的子匹配。只讀。
•leftContext ($`),返回被查找的字符串中從字符串開始位置到最后匹配之前的位置之間的字符。只讀。
•rightContext ($’),返回被搜索的字符串中從最后一個匹配位置開始到字符串結尾之間的字符。只讀。
String對象一些和正則表達式相關的方法
•match,找到一個或多個正則表達式的匹配。
•replace,替換與正則表達式匹配的子串。
•search,檢索與正則表達式相匹配的值。
•split,把字符串分割為字符串數(shù)組。
測試正則表達式是如何工作的!
var re = /he/;//最簡單的正則表達式,將匹配he這個單詞
var str = “he”;
alert(re.test(str));//true
str = “we”;
alert(re.test(str));//false
str = “HE”;
alert(re.test(str));//false,大寫,如果要大小寫都匹配可以指定i標志(i是ignoreCase或case-insensitive的表示)
re = /he/i;
alert(re.test(str));//true
str = “Certainly!He loves her!”;
alert(re.test(str));//true,只要包含he(HE)就符合,如果要只是he或HE,不能有其它字符,則可使用^和$
re = /^he/i;//脫字符(^)代表字符開始位置
alert(re.test(str));//false,因為he不在str最開始
str = “He is a good boy!”;
alert(re.test(str));//true,He是字符開始位置,還需要使用$
re = /^he$/i;//$表示字符結束位置
alert(re.test(str));//false
str = “He”;
alert(re.test(str));//true
//當然,這樣不能發(fā)現(xiàn)正則表達式有多強大,因為我們完全可以在上面的例子中使用==或indexOf
re = /s/;// s匹配任何空白字符,包括空格、制表符、換頁符等等
str= “user Name”;//用戶名包含空格
alert(re.test(str));//true
str = “user Name”;//用戶名包含制表符
alert(re.test(str));//true
re=/^[a-z]/i;//[]匹配指定范圍內的任意字符,這里將匹配英文字母,不區(qū)分大小寫
str=”variableName”;//變量名必須以字母開頭
alert(re.test(str));//true
str=”123abc”;
alert(re.test(str));//false
當然,僅僅知道了字符串是否匹配模式還不夠,我們還需要知道哪些字符匹配了模式
var re = /^[a-z]+s+d+$/i; //+號表示字符至少要出現(xiàn)1次,s表示空白字符,d表示一個數(shù)字
alert(re.test(osVersion));//true,但我們想知道主版本號
//另一個方法exec,返回一個數(shù)組,數(shù)組的第一個元素為完整的匹配內容
re=/^[a-z]+s+d+$/i;
arr = re.exec(osVersion);
alert(arr[0]);//將osVersion完整輸出,因為整個字符串剛好匹配re
//我只需要取出數(shù)字
re=/d+/;
var arr = re.exec(osVersion);
alert(arr[0]);//8
更復雜的用法,使用子匹配
re=/^[a-z]+s+(d+)$/i;//用()來創(chuàng)建子匹配
arr =re.exec(osVersion);
alert(arr[0]);//整個osVersion,也就是正則表達式的完整匹配
alert(arr[1]);//8,第一個子匹配,事實也可以這樣取出主版本號
alert(arr.length);//2
osVersion = “Ubuntu 8.10”;//取出主版本號和次版本號
re = /^[a-z]+s+(d+).(d+)$/i;//.是正則表達式元字符之一,若要用它的字面意義須轉義
arr = re.exec(osVersion);
alert(arr[0]);//完整的osVersion
alert(arr[1]);//8
alert(arr[2]);//10
注意,當字符串不匹配re時,exec方法將返回null
String對象的一些和正則表達式有關的方法
[Ctrl+A 全選 注:如需引入外部Js需刷新才能執(zhí)行]
注意,當search方法沒有找到匹配時,將返回-1
類似于exec方法,String對象的match方法也用于將字符串與正則表達式進行匹配并返回結果數(shù)組
var re = /[A-Z]/;//匹配所有大寫字母
var arr = str.match(re);//返回數(shù)組
alert(arr);//數(shù)組中只會包含一個M,因為我們沒有使用全局匹配
re = /[A-Z]/g;
arr = str.match(re);
alert(arr);//M,C,J,H
//從字符串中抽取單詞
re = /b[a-z]b/i;//b表示單詞邊界
str = “one two three four”;
alert(str.match(re));//one,two,three,four
RegExp對象實例的一些屬性
Js代碼
alert(re.source);//將[a-z]字符串輸出
//請注意,直接alert(re)會將正則表達式連同前向斜線與標志輸出,這是re.toString方法定義的
每個RegExp對象的實例具有l(wèi)astIndex屬性,它是被查找字符串中下一次成功匹配的開始位置,默認值是-1。 lastIndex 屬性被 RegExp 對象的 exec 和 test 方法修改.并且它是可寫的.
//exec方法執(zhí)行后,修改了re的lastIndex屬性,
var str = “Hello,World!!!”;
var arr = re.exec(str);
alert(re.lastIndex);//0,因為沒有設置全局標志
re = /[A-Z]/g;
arr = re.exec(str);
alert(re.lastIndex);//1
arr = re.exec(str);
alert(re.lastIndex);//7
當匹配失?。ê竺鏇]有匹配),或lastIndex值大于字符串長度時,再執(zhí)行exec等方法會將lastIndex設為0(開始位置)
var str = “Hello,World!!!”;
re.lastIndex = 120;
var arr = re.exec(str);
alert(re.lastIndex);//0
RegExp對象的靜態(tài)屬性
var re = /[A-Z]/;
var str = “Hello,World!!!”;
var arr = re.exec(str);
alert(RegExp.input);//Hello,World!!!
re.exec(“tempstr”);
alert(RegExp.input);//仍然是Hello,World!!!,因為tempstr不匹配
//lastMatch 最后匹配的字符
re = /[a-z]/g;
str = “hi”;
re.test(str);
alert(RegExp.lastMatch);//h
re.test(str);
alert(RegExp[“$&”]);//i ,$&是lastMatch的短名字,但由于它不是合法變量名,所以要。。
//lastParen 最后匹配的分組
re = /[a-z](d+)/gi;
str = “Class1 Class2 Class3”;
re.test(str);
alert(RegExp.lastParen);//1
re.test(str);
alert(RegExp[“$+”]);//2
//leftContext 返回被查找的字符串中從字符串開始位置到最后匹配之前的位置之間的字符
//rigthContext 返回被搜索的字符串中從最后一個匹配位置開始到字符串結尾之間的字符
re = /[A-Z]/g;
str = “123ABC456”;
re.test(str);
alert(RegExp.leftContext);//123
alert(RegExp.rightContext);//BC456
re.test(str);
alert(RegExp[“$`”]);//123A
alert(RegExp[“$'”]);//C456
multiline屬性返回正則表達式是否使用多行模式,這個屬性不針對某個正則表達式實例,而是針對所有正則表達式,并且這個屬性可寫.(IE與Opera不支持這個屬性)
//因為IE,Opera不支持這個屬性,所以最好還是單獨指定
var re = /w+/m;
alert(re.multiline);
alert(RegExp[“$*”]);//RegExp對象的靜態(tài)屬性不會因為給RegExp某個對象實例指定了m標志而改變
RegExp.multiline = true;//這將打開所有正則表達式實例的多行匹配模式
alert(RegExp.multiline);
使用元字符注意事項:元字符是正則表達式的一部分,當我們要匹配正則表達式本身時,必須對這些元字符轉義.下面是正則表達式用到的所有元字符
( [ { ^ $ | ) ? * + .
var re = /?/;
alert(re.test(str));//出錯,因為?是元字符,必須轉義
re = /?/;
alert(re.test(str));//true
使用RegExp構造函數(shù)與使用正則表達式字面量創(chuàng)建正則表達式注意點
alert(str);//只會輸出?
var re = /?/;//將匹配?
alert(re.test(str));//true
re = new RegExp(“?”);//出錯,因為這相當于re = /?/
re = new RegExp(“\?”);//正確,將匹配?
alert(re.test(str));//true
既然雙重轉義這么不友好,所以還是用正則表達式字面量的聲明方式
如何在正則表達式中使用特殊字符?
var re = /^x43x4A$/;//將匹配CJ
alert(re.test(“CJ”));//true
//也可使用八進制方式
re = /^103112$/;//將匹配CJ
alert(re.test(“CJ”));//true
//還可以使用Unicode編碼
re =/^u0043u004A$/;//使用 Unicode,必須使用u開頭,接著是字符編碼的四位16進制表現(xiàn)形式
alert(re.test(“CJ”));
另處,還有一些其它的預定義特殊字符,如下表所示:
字符 描述
n 換行符
r 回車符
t 制表符
f 換頁符(Tab)
cX 與X對應的控制字符
b 退格符(BackSpace)
v 垂直制表符