php輸出csv亂碼的解決辦法:首先打開相應(yīng)的代碼文件;然后在文件的開始輸出BOM頭,并告訴windows CSV文件的編碼方式;最后讓Excel打開CSV時(shí)采用正確的編碼即可。
本文操作環(huán)境:Windows7系統(tǒng)、PHP7.1版、Dell G3電腦。
PHP導(dǎo)出CSV文件出現(xiàn)亂碼的解決方法
在做項(xiàng)目時(shí)碰到使用外語(yǔ)的情況下,我們就會(huì)使用UTF-8編碼。但是,在用PHP導(dǎo)出CSV文件時(shí),如果寫入的數(shù)據(jù)是使用UTF-8編碼的日語(yǔ)、韓語(yǔ)之類的外文,就會(huì)出現(xiàn)亂碼。
要解決PHP生成CSV文件的亂碼問題,只需要在文件的開始輸出BOM頭,告訴windows CSV文件的編碼方式,從而讓Excel打開CSV時(shí)采用正確的編碼。
什么是BOM
在UCS 編碼中有一個(gè)叫做”ZERO WIDTH NO-BREAK SPACE”的字符,它的編碼是FEFF。而FFFE在UCS中是不存在的字符,所以不應(yīng)該出現(xiàn)在實(shí)際傳輸中。UCS規(guī)范建議我們?cè)趥鬏斪止?jié)流前,先傳輸字符”ZERO WIDTH NO-BREAK SPACE”。這樣如果接收者收到FEFF,就表明這個(gè)字節(jié)流是Big-Endian的;如果收到FFFE,就表明這個(gè)字節(jié)流是Little-Endian的。因此
字符”ZERO WIDTH NO-BREAK SPACE”又被稱作BOM。UTF-8不需要BOM來表明字節(jié)順序,但可以用BOM來表明編碼方式。字符”ZERO WIDTH NO-BREAK SPACE”的UTF-8編碼是EF BB BF。所以如果接收者收到以EF BB BF開頭的字節(jié)流,就知道這是UTF-8編碼了。Windows就是使用BOM來標(biāo)記文本文件的編碼方式的。
【推薦學(xué)習(xí):《PHP視頻教程》】
在所有內(nèi)容輸出之前
print(chr(0xEF).chr(0xBB).chr(0xBF));
幾個(gè)UTF編碼的BOM頭
define ('UTF32_BIG_ENDIAN_BOM' , chr(0x00) . chr(0x00) . chr(0xFE) . chr(0xFF)); define ('UTF32_LITTLE_ENDIAN_BOM', chr(0xFF) . chr(0xFE) . chr(0x00) . chr(0x00)); define ('UTF16_BIG_ENDIAN_BOM' , chr(0xFE) . chr(0xFF)); define ('UTF16_LITTLE_ENDIAN_BOM', chr(0xFF) . chr(0xFE)); define ('UTF8_BOM' , chr(0xEF) . chr(0xBB) . chr(0xBF));
完整的代碼
header('Expires: 0'); header('Cache-control: private'); header('Cache-Control: must-revalidate, post-check=0, pre-check=0'); header('Content-Description: File Transfer'); header('Content-Encoding: UTF-8'); header('Content-type: text/csv; charset=UTF-8'); header('Content-Disposition: attachment; filename=Customers_Export.csv'); echo "xEFxBBxBF"; // UTF-8 BOM // print(chr(0xEF).chr(0xBB).chr(0xBF));