相信很多人在使用PHP的過程中都遇到過生成文件亂碼的情況,不論是使用fwrite還是file_put_contents寫入。可能你會(huì)先嘗試從編碼入手嘗試解決,但最終的結(jié)果往往是不理想的,盡管我們都將其轉(zhuǎn)換為了UTF-8編碼了…
那么究其根本原因是什么呢?就是缺少頭部BOM(當(dāng)然,這里指的肯定不是Js的Bom)。
BOM
既然提到了BOM,那么可能有的同學(xué)不太了解這個(gè)家伙,這里我簡(jiǎn)單說一下,老鳥可以跳過。在Windows下用記事本之類的程序?qū)⑽谋疚募4鏋閁TF-8格式時(shí),記事本會(huì)在文件頭前面加上幾個(gè)不可見的字符(EF BB BF),就是所謂的BOM(Byte order Mark)。
不僅限于 記事本保存的文件,只要在文件的開口包含了“EF BB BF” 幾個(gè)不可見的字符(十六進(jìn)制應(yīng)該是是xEFxBBxBF,用二進(jìn)制編輯文件可見)。這像是一個(gè)約定俗成的東西,當(dāng)系統(tǒng)看到這玩意的時(shí)候,就會(huì)覺得你這個(gè)文件是UTF-8編碼的。
這就是為什么當(dāng)文件沒有BOM時(shí),你給用戶呈現(xiàn)的文件就可能是亂碼的原因了。
PS : 其實(shí)你可以將BOM理解成HTML中的charset屬性和XML中的encoding屬性,就是起一個(gè)標(biāo)識(shí)作用。
解決辦法:
那么如何在PHP中輸出BOM呢?
答案是在所有內(nèi)容輸出之前輸出:
print(chr(0xEF).chr(0xBB).chr(0xBF));
當(dāng)然,如果你是在生成文件,可能是下面兩種:
fwrite($file, chr(0xEF).chr(0xBB).chr(0xBF)); file_put_contents($file, chr(0xEF).chr(0xBB).chr(0xBF));
以上內(nèi)容僅供參考!
推薦教程:PHP視頻教程