前面的話
正則表達(dá)式不能獨(dú)立使用,它只是一種用來(lái)定義字符串的規(guī)則模式,必須在相應(yīng)的正則表達(dá)式函數(shù)中應(yīng)用,才能實(shí)現(xiàn)對(duì)字符串的匹配、查找、替換及分割等操作。前面介紹了正則表達(dá)式的基礎(chǔ)語(yǔ)法,本文將詳細(xì)介紹正則表達(dá)式函數(shù)
匹配與查找
【preg_match()】
preg_match()函數(shù)用來(lái)執(zhí)行一個(gè)正則表達(dá)式匹配,搜索subject與pattern給定的正則表達(dá)式的一個(gè)匹配。返回pattern的匹配次數(shù)。它的值將是0次(不匹配)或1次,因?yàn)閜reg_match()在第一次匹配后將會(huì)停止搜索。preg_match_all()不同于此,它會(huì)一直搜索subject直到到達(dá)結(jié)尾。如果發(fā)生錯(cuò)誤preg_match()返回FALSE
int preg_match ( string $pattern , string $subject [, array &$matches [, int $flags = 0 [, int $offset = 0 ]]] )
pattern表示要搜索的模式,字符串類(lèi)型
subject表示輸入字符串
如果提供了參數(shù)matches,它將被填充為搜索結(jié)果。$matches[0]將包含完整模式匹配到的文本, $matches[1] 將包含第一個(gè)捕獲子組匹配到的文本,以此類(lèi)推
flags可以被設(shè)置為以下標(biāo)記:1、PREG_OFFSET_CAPTURE。如果傳遞了這個(gè)標(biāo)記,對(duì)于每一個(gè)出現(xiàn)的匹配返回時(shí)會(huì)附加字符串偏移量(相對(duì)于目標(biāo)字符串的)。注意:這會(huì)改變填充到matches參數(shù)的數(shù)組,使其每個(gè)元素成為一個(gè)由第0個(gè)元素是匹配到的字符串,第1個(gè)元素是該匹配字符串在目標(biāo)字符串subject中的偏移量;2、offset。通常,搜索從目標(biāo)字符串的開(kāi)始位置開(kāi)始??蛇x參數(shù)offset用于指定從目標(biāo)字符串的某個(gè)未知開(kāi)始搜索(單位是字節(jié))
<?php //從URL中獲取主機(jī)名稱(chēng) preg_match('@^(?:http://)?([^/]+)@i', "http://www.php.net/index.html", $matches); $host = $matches[1];//獲取主機(jī)名稱(chēng)的后面兩部分 preg_match('/[^.]+.[^.]+$/', $host, $matches);//domain name is: php.netecho "domain name is: {$matches[0]}"; ?>
<?php $pattern = '/www.[^./]+.com/i'; $subject = 'www.baidu.com,www.qq.com,www.cnblogs.com';preg_match($pattern,$subject,$matches);/*array (size=1) 0 => string 'www.baidu.com' (length=13) */var_dump($matches); ?>
【preg_match_all()】
preg_match_all()與preg_match()類(lèi)似,不同的是preg_match()在第一次匹配之后就會(huì)停止搜索,而函數(shù)preg_match_all()則會(huì)一直搜索到指定字符串的結(jié)尾,可以獲取到所有匹配到的結(jié)果
int preg_match_all ( string $pattern , string $subject [, array &$matches [, int $flags = PREG_PATTERN_ORDER [, int $offset = 0 ]]] )
<?php $pattern = '/www.[^./]+.com/i';$subject = 'www.baidu.com,www.qq.com,www.cnblogs.com'; preg_match_all($pattern,$subject,$matches); /* array (size=1) 0 => array (size=3) 0 => string 'www.baidu.com' (length=13) 1 => string 'www.qq.com' (length=10) 2 => string 'www.cnblogs.com' (length=15) */ var_dump($matches); ?>
【preg_grep()】
preg_grep()返回給定數(shù)組input中與模式pattern 匹配的元素組成的數(shù)組
array preg_grep ( string $pattern , array $input [, int $flags = 0 ] )
如果flags設(shè)置為PREG_GREP_INVERT,這個(gè)函數(shù)返回輸入數(shù)組中與 給定模式pattern不匹配的元素組成的數(shù)組
<?php $pattern = '/www.[^./]+.com/i'; $subject = ['baidu.com','www.qq.com','www.cnblogs.com'];var_dump (preg_grep($pattern,$subject)); ?>
替換
【preg_replace()】
preg_replace()執(zhí)行一個(gè)正則表達(dá)式的搜索替換,搜索subject匹配pattern的部分,以replacement進(jìn)行替換 mixed preg_replace ( mixed $pattern , mixed $replacement , mixed $subject [, int $limit = -1 [, int &$count ]] )
replacement表示用于替換的字符串或字符串?dāng)?shù)組。如果這個(gè)參數(shù)是一個(gè)字符串,并且pattern是一個(gè)數(shù)組,那么所有的模式都使用這個(gè)字符串進(jìn)行替換。如果pattern和replacement都是數(shù)組,每個(gè)pattern使用replacement中對(duì)應(yīng)的元素進(jìn)行替換。如果replacement中的元素比pattern中的少,多出來(lái)的pattern使用空字符串進(jìn)行替換
<?php $string = 'April 15, 2016';$pattern = '/(w+) (d+), (d+)/i'; $replacement = '${1}1,$3';//April1,2016echo preg_replace($pattern, $replacement, $string); ?><?php $string = 'The quick brown fox jumped over the lazy dog.'; $patterns = array(); $patterns[0] = '/quick/'; $patterns[1] = '/brown/'; $patterns[2] = '/fox/';$replacements = array(); $replacements[2] = 'bear';$replacements[1] = 'black'; $replacements[0] = 'slow';//The bear black slow jumped over the lazy dog.echo preg_replace($patterns, $replacements, $string); ?>
【preg_replace_callback()】
preg_replace_callback()執(zhí)行一個(gè)正則表達(dá)式搜索并且使用一個(gè)回調(diào)進(jìn)行替換
mixed preg_replace_callback ( mixed $pattern , callable $callback , mixed $subject [, int $limit = -1 [, int &$count ]] )
<?php // 將文本中的年份增加一年. $text = "April fools day is 04/01/2002"; $text.= "Last christmas was 12/24/2001"; // 回調(diào)函數(shù) function next_year($matches){ // 通常: $matches[0]是完成的匹配 // $matches[1]是第一個(gè)捕獲子組的匹配 // 以此類(lèi)推 return $matches[1].($matches[2]+1);}>
【preg_filter()】
preg_filter() 執(zhí)行一個(gè)正則表達(dá)式搜索和替換,等價(jià)于preg_replace()除了它僅僅返回(可能經(jīng)過(guò)轉(zhuǎn)化)與目標(biāo)匹配的結(jié)果
mixed preg_filter ( mixed $pattern , mixed $replacement , mixed $subject [, int $limit = -1 [, int &$count ]] )
<?php $subject = array('1', 'a', '2', 'b', '3', 'A', 'B', '4'); $pattern = array('/d/', '/[a-z]/', '/[1a]/'); $replace = array('A:$0', 'B:$0', 'C:$0'); ?>
分割
【preg_split()】 preg_split()通過(guò)一個(gè)正則表達(dá)式分隔字符串 array preg_split ( string $pattern , string $subject [, int $limit = -1 [, int $flags = 0 ]] )
如果指定limit,將限制分隔得到的子串最多只有l(wèi)imit個(gè),返回的最后一個(gè)子串將包含所有剩余部分。limit值為-1,0或null時(shí)都代表"不限制";可以使用null跳過(guò)對(duì)flags的設(shè)置
flags可以是任何下面標(biāo)記的組合(以位或運(yùn)算 | 組合):PREG_SPLIT_NO_EMPTY——如果這個(gè)標(biāo)記被設(shè)置,preg_split()將進(jìn)返回分隔后的非空部分;PREG_SPLIT_DELIM_CAPTURE——如果這個(gè)標(biāo)記設(shè)置了,用于分隔的模式中的括號(hào)表達(dá)式將被捕獲并返回;PREG_SPLIT_OFFSET_CAPTURE——如果這個(gè)標(biāo)記被設(shè)置,對(duì)于每一個(gè)出現(xiàn)的匹配返回時(shí)將會(huì)附加字符串偏移量。注意:這將會(huì)改變返回?cái)?shù)組中的每一個(gè)元素,使其每個(gè)元素成為一個(gè)由第0個(gè)元素為分隔后的子串,第1個(gè)元素為該子串在subject中的偏移量組成的數(shù)組
<?php//使用逗號(hào)或空格(包含" ", , , , f)分隔短語(yǔ)$keywords = preg_split("/[s,]+/", "hypertext language, programming");/*Array ( [0] => hypertext [1] => language [2] => programming ) */print_r($keywords);?>
轉(zhuǎn)義
【preg_quote()】
preg_quote()轉(zhuǎn)義正則表達(dá)式字符
string preg_quote ( string $str [, string $delimiter = NULL ] )
正則表達(dá)式特殊字符有: . + * ? [ ^ ] $ ( ) { } = ! < > | : -
<?php$keywords = '$40 for a g3/400';$keywords = preg_quote($keywords, '/');echo $keywords; // 返回 $40 for a g3/400?>