php字符串長(zhǎng)度不一致的解決辦法:1、通過(guò)mb_detect_encoding()函數(shù)查看字符串的編碼方式;2、通過(guò)mb_strlen函數(shù)查看具體字符長(zhǎng)度;3、使用正則表達(dá)式“preg_match_all('/[x{4e00}-x{9fff}]+/u', $str1, $matches);”剔除非中文字符即可。
本教程操作環(huán)境:Windows10系統(tǒng)、PHP8.1版、DELL G3電腦
php 字符串長(zhǎng)度不一致怎么辦?
php 中字符串一樣但長(zhǎng)度不等的問(wèn)題
問(wèn)題:
如圖所示 咋眼看去兩個(gè)一樣的中文字符串“后勤保障部”,但一個(gè)長(zhǎng)度為21 一個(gè)為15。
首先直覺(jué)可能會(huì)認(rèn)為是編碼方式不一樣導(dǎo)致的,
通過(guò)mb_detect_encoding()
函數(shù)查看兩個(gè)字符串的編碼方式 代碼如下
<?php header("Content-Type: text/html;charset=utf-8"); $data[0]=$str1="后勤保障部"; $data[1]=$str2="后勤保障部"; var_dump($data); //查看編碼方式 $encode1 = mb_detect_encoding($str1, array("ASCII","UTF-8","GB2312","GBK","BIG5")); $encode2 = mb_detect_encoding($str2, array("ASCII","UTF-8","GB2312","GBK","BIG5")); echo "str1='".$str1."'"." 編碼:".$encode1."</br>"; echo "str2='".$str2."'"." 編碼:".$encode2."</br>"; ?>
但輸出結(jié)果都是UTF-8
那么是什么原因呢 ,我們?cè)谳敵隹聪戮唧w字符長(zhǎng)度
<?php header("Content-Type: text/html;charset=utf-8"); $data[0]=$str1="后勤保障部"; $data[1]=$str2="后勤保障部"; var_dump($data); //查看編碼方式 $encode1 = mb_detect_encoding($str1, array("ASCII","UTF-8","GB2312","GBK","BIG5")); $encode2 = mb_detect_encoding($str2, array("ASCII","UTF-8","GB2312","GBK","BIG5")); //當(dāng)mb_strlen的內(nèi)碼選擇為UTF-8的時(shí)候,則會(huì)將中文字符當(dāng)成一個(gè)字符 //strlen,得到的是字符串所占的字節(jié)數(shù) echo "str1='".$str1."'".": 字符長(zhǎng)度:".mb_strlen($str1).": 字節(jié)長(zhǎng)度:".strlen($str1)." 編碼:".$encode1."</br>"; echo "str2='".$str2."'".": 字符長(zhǎng)度:".mb_strlen($str2).": 字節(jié)長(zhǎng)度:".strlen($str2)." 編碼:".$encode2."</br>"; ?>
輸出結(jié)果如下:
發(fā)現(xiàn)字符串str1有7個(gè)中文字符,但實(shí)際只顯示了5個(gè),也就是“后勤保障部”
通過(guò)截取str1最后兩個(gè)字符查看
//截取str1后面兩個(gè)未顯示字符 $res=mb_substr($str1, 5,2); echo "最后兩字符:".$res."</br>"; echo mb_strlen($res);
無(wú)法echo顯示,但確實(shí)占有兩個(gè)字符
如果實(shí)際要求這看上去一樣的字符串就相等的話,需要進(jìn)行處理,處理就是剔除非中文字符:
//剔除str1字串中未顯示的字符(非中文字符) preg_match_all('/[x{4e00}-x{9fff}]+/u', $str1, $matches); $str1 = join('', $matches[0]);
最終代碼如下
<?php header("Content-Type: text/html;charset=utf-8"); $data[0]=$str1="后勤保障部"; $data[1]=$str2="后勤保障部"; var_dump($data); //查看編碼方式 $encode1 = mb_detect_encoding($str1, array("ASCII","UTF-8","GB2312","GBK","BIG5")); $encode2 = mb_detect_encoding($str2, array("ASCII","UTF-8","GB2312","GBK","BIG5")); //當(dāng)mb_strlen的內(nèi)碼選擇為UTF-8的時(shí)候,則會(huì)將中文字符當(dāng)成一個(gè)字符 //strlen,得到的是字符串所占的字節(jié)數(shù) echo "str1='".$str1."'".": 字符長(zhǎng)度:".mb_strlen($str1).": 字節(jié)長(zhǎng)度:".strlen($str1)." 編碼:".$encode1."</br>"; echo "str2='".$str2."'".": 字符長(zhǎng)度:".mb_strlen($str2).": 字節(jié)長(zhǎng)度:".strlen($str2)." 編碼:".$encode2."</br>"; //截取str1后面兩個(gè)未顯示字符 echo "</br>------------------截取str1后面兩個(gè)未顯示字符---------------------</br>"; $res=mb_substr($str1, 5,2); echo "str1最后兩字符: ".$res."</br>"; echo "str1長(zhǎng)度: ".mb_strlen($res)."</br>"; //比較 echo "</br>--------------------------相等比較----------------------------------</br>"; echo "str1 與 str2比較: "; echo strcomp($str1,$str2)."</br>"; echo "str2 與 str2比較: "; echo strcomp($str2,$str2)."</br>"; //剔除str1字串中非中文 preg_match_all('/[x{4e00}-x{9fff}]+/u', $str1, $matches); $str1 = join('', $matches[0]); echo "</br>---------------------剔除str1字串中非中文后----------------------</br>"; echo "str1='".$str1."'".": 字符長(zhǎng)度:".mb_strlen($str1).": 字節(jié)長(zhǎng)度:".strlen($str1)." 編碼:".$encode1."</br>"; echo "str1 與 str2比較: "; echo strcomp($str1,$str2)."</br>"; function strcomp($str1,$str2){ if($str1 == $str2){ return "相等"; }else{ return "不等"; } } ?>
運(yùn)行結(jié)果
注:
將21字節(jié)的str1復(fù)制到phpmyadmin的sql輸入框,顯示如下
嗯 就是多的那兩個(gè)字符
推薦學(xué)習(xí):《PHP視頻教程》