java 漢字幾個(gè)字節(jié)
java中,只要是字符,不管是數(shù)字還是英文還是漢字,都占2個(gè)字節(jié),都是一個(gè)char。
char c1 = '中'; char c2 = 'A'; char c3 = '1';
確切說(shuō),Unicode編碼是指一類(lèi)編碼的統(tǒng)稱(chēng),而非某個(gè)具體編碼。utf-8跟unicode是不一樣的。
以u(píng)tf8為例,utf8是一個(gè)變長(zhǎng)編碼標(biāo)準(zhǔn),可以以1~4個(gè)字節(jié)表示一個(gè)字符,而中文占3個(gè)字節(jié),ascII字符占1個(gè)字節(jié)。
因?yàn)閖ava是以u(píng)nicode作為編碼方式的。unicode是一個(gè)定長(zhǎng)的編碼標(biāo)準(zhǔn),每個(gè)字符都是2個(gè)字節(jié),也就是1個(gè)char類(lèi)型的空間。
擴(kuò)展知識(shí):
Unicode是一個(gè)編碼方案,Unicode 是為了解決傳統(tǒng)的字符編碼方案的局限而產(chǎn)生的,它為每種語(yǔ)言中的每個(gè)字符設(shè)定了統(tǒng)一并且唯一的二進(jìn)制編碼,以滿(mǎn)足跨語(yǔ)言、跨平臺(tái)進(jìn)行文本轉(zhuǎn)換、處理的要求。Unicode 編碼共有三種具體實(shí)現(xiàn),分別為utf-8,utf-16,utf-32,其中utf-8占用一到四個(gè)字節(jié),utf-16占用二或四個(gè)字節(jié),utf-32占用四個(gè)字節(jié)。目前Unicode 碼在全球范圍的信息交換領(lǐng)域均有廣泛的應(yīng)用。
php中文網(wǎng),大量的免費(fèi)Java入門(mén)教程,歡迎在線學(xué)習(xí)!