久久久久久久视色,久久电影免费精品,中文亚洲欧美乱码在线观看,在线免费播放AV片

<center id="vfaef"><input id="vfaef"><table id="vfaef"></table></input></center>

<p id="vfaef"><kbd id="vfaef"></kbd></p>

<pre id="vfaef"><u id="vfaef"></u></pre>

<thead id="vfaef"><input id="vfaef"></input></thead>

<button id="oij8d"></button><legend id="oij8d"><rt id="oij8d"></rt></legend>

<option id="oij8d"><acronym id="oij8d"><listing id="oij8d"></listing></acronym></option>

當(dāng)前位置：站長資訊網(wǎng) > 編程知識 > 正文

java出現(xiàn)亂碼的原因與解決方法詳解

2019-11-28 分類：編程知識閱讀(1196) 評論(0)

java出現(xiàn)亂碼的原因與解決方法詳解

java在字符串中統(tǒng)一用Unicode表示。（推薦：java視頻教程）

對于任意一個字符串：String string = “測試字符串”;

如果源文件是GBK編碼，操作系統(tǒng)默認(rèn)環(huán)境編碼也為GBK，那么編譯的時候，JVM將按照GBK編碼將字節(jié)數(shù)組解析為字符，然后將字符轉(zhuǎn)換為Unicode格式的字節(jié)數(shù)組，作為內(nèi)部存儲(字節(jié)數(shù)組→字符→Unicode字節(jié)數(shù)組)

當(dāng)打印這個字符串時，JVM根據(jù)操作系統(tǒng)本地的語言環(huán)境，將Unicode轉(zhuǎn)換為GBK，然后操作系統(tǒng)將GBK格式的內(nèi)容顯示出來。

當(dāng)源碼文件是UTF-8, 我們需要通知編譯器源碼的格式，javac -encoding utf-8 … , 編譯時，JVM按照utf-8 解析成字符，然后轉(zhuǎn)換為unicode格式的字節(jié)數(shù)組，那么不論源碼文件是什么格式，同樣的字符串，最后得到的unicode字節(jié)數(shù)組是完全一致的，顯示的時候，也是轉(zhuǎn)成GBK來顯示（跟OS環(huán)境有關(guān)）

亂碼是如何產(chǎn)生的？

本質(zhì)上都是由于字符串原本的編碼格式與讀取時解析用的編碼格式不一致導(dǎo)致的。

亂碼指的是程序顯示出來的字符文本無法用任何語言去解讀。一般情況下會包含大量的?。亂碼問題是所有計算機用戶或多或少會遇到的問題。

造成亂碼的原因就是因為使用了錯誤的字符編碼去解碼字節(jié)流，因此當(dāng)我們在思考任何跟文本顯示有關(guān)的問題時，請時刻保持清醒：當(dāng)前使用的字符編碼是什么。只有這樣，我們才能正確分析和處理亂碼問題。

例如最常見的網(wǎng)頁亂碼問題。如果你是網(wǎng)站技術(shù)人員，遇到這樣的問題，需要檢查以下原因：

1、服務(wù)器返回的響應(yīng)頭Content-Type沒有指明字符編碼

2、網(wǎng)頁內(nèi)是否使用META HTTP-EQUIV標(biāo)簽指定了字符編碼

3、網(wǎng)頁文件本身存儲時使用的字符編碼和網(wǎng)頁聲明的字符編碼是否一致

java代碼中的亂碼問題如何解決呢？

例如：String s = “測試字符串”;

System.out.println( new String(s.getBytes(),"UTF-8"));  //錯誤，因為getBytes()默認(rèn)使用GBK編碼， 而解析時使用UTF-8編碼，肯定出錯。

其中g(shù)etBytes()是將Unicode轉(zhuǎn)換為操作系統(tǒng)默認(rèn)格式的字節(jié)數(shù)組，即“測試字符串”的GBK格式，new String (bytes, Charset) 中的charset 是指定讀取byte的方式，這里指定為UTF-8，即把bytes的內(nèi)容當(dāng)做UTF-8來讀取。

如下兩種方式得到的結(jié)果都是正確的，因為它們的源內(nèi)容編碼和解析用的編碼是一致的。

System.out.println( new String(s.getBytes(),"GBK")); System.out.println( new String(s.getBytes("UTF-8"),"UTF-8"));

那么，如何利用getBytes 和 new String() 來進(jìn)行編碼轉(zhuǎn)換呢？

網(wǎng)上流傳著一種錯誤的方法:

GBK--> UTF-8: new String( s.getBytes("GBK") , "UTF-8);

這種方式是完全錯誤的，因為getBytes 的編碼與 UTF-8 不一致，肯定是亂碼。

但是為什么在tomcat 下，使用 new String(s.getBytes(“iso-8859-1”) ,”GBK”) 卻可以用呢？

答案是：

tomcat 默認(rèn)使用iso-8859-1編碼，也就是說，如果原本字符串是GBK的，tomcat傳輸過程中，將GBK轉(zhuǎn)成iso-8859-1了，默認(rèn)情況下，使用iso-8859-1讀取中文肯定是有問題的。

那么我們需要將iso-8859-1 再轉(zhuǎn)成GBK，而iso-8859-1 是單字節(jié)編碼的，即他認(rèn)為一個字節(jié)是一個字符，那么這種轉(zhuǎn)換不會對原來的字節(jié)數(shù)組做任何改變，因為字節(jié)數(shù)組本來就是由單個字節(jié)組成的。

如果之前用GBK編碼，那么轉(zhuǎn)成iso-8859-1后編碼內(nèi)容完全沒變，則 s.getBytes(“iso-8859-1”) 實際上還是原來GBK的編碼內(nèi)容則 new String(s.getBytes(“iso-8859-1”) ,”GBK”) 就可以正確解碼了。所以說這是一種巧合。

如何正確的將GBK轉(zhuǎn)UTF-8 ? （實際上是unicode轉(zhuǎn)UTF-8)

//利用getBytes將unicode字符串轉(zhuǎn)成UTF-8格式的字節(jié)數(shù)組，然后用utf-8 對這個字節(jié)數(shù)組解碼成新的字符串 new String( s.getBytes("utf-8") , "utf-8");  UTF-8 轉(zhuǎn)GBK原理也是一樣 new String( s.getBytes("GBK") , "GBK");

其實核心工作都由getBytes(charset)做了。getBytes的JDK描述：Encoding this String into a sequence of bytes using the named charset,storing the result into a new byte array.

OutputStreamWriter w1 = new OutputStreamWriter(new FileOutputStream("D:\file1.txt"),"UTF-8"); InputStreamReader( stream, charset)

可以幫助我們輕松的按照指定編碼讀寫文件。

附錄：
HttpClient post請求中文亂碼問題解決

最近接到現(xiàn)場同事反饋，在掉接口的過程中，廠家收到的請求報文中文是亂碼的。我檢查了版控的代碼，找到如下解決辦法：

原始代碼（中文亂碼）：

HttpPost httpPost = new HttpPost(url); DefaultHttpClient httpClient = new DefaultHttpClient(); //請求頭 httpPost.setHeader("Accept", MediaType.APPLICATION_JSON); httpPost.setHeader("Content-Type", "application/json;charset=UTF-8"); //請求實體 StringEntity reqEntity = new StringEntity(reqStr); httpPost.setEntity(reqEntity); //獲取響應(yīng) HttpResponse httpResp = httpClient.execute(httpPost); HttpEntity respEntity = httpResp.getEntity();

解決辦法：

方法一： //請求實體 HttpEntity reqEntity = new ByteArrayEntity(reqStr.getBytes("UTF-8")); //StringEntity reqEntity = new StringEntity(reqStr); httpPost.setEntity(reqEntity);  方法二： //請求實體 StringEntity reqEntity = new StringEntity(reqStr,Charset.forName("UTF-8")); httpPost.setEntity(reqEntity);

贊(0)

標(biāo)簽：app exec java jdk set Tomcat 操作系統(tǒng)服務(wù)器計算機

相關(guān)推薦

網(wǎng)站地圖滬ICP備18035694號-2

滬公網(wǎng)安備31011702889846號