在UTF-8編碼中,一個(gè)中文字符等于三個(gè)字節(jié),一個(gè)中文標(biāo)點(diǎn)符號(hào)占三個(gè)字節(jié);一個(gè)英文字符等于一個(gè)字節(jié),一個(gè)英文標(biāo)點(diǎn)占一個(gè)字節(jié);一個(gè)數(shù)字符號(hào)等于一個(gè)字節(jié)。
本文操作環(huán)境:windows10系統(tǒng),DELL G3電腦。
在UTF-8編碼中:一個(gè)中文等于三個(gè)字節(jié),中文標(biāo)點(diǎn)占三個(gè)字節(jié)。
一個(gè)英文字符等于一個(gè)字節(jié),英文標(biāo)點(diǎn)占一個(gè)字節(jié)。
Unicode編碼:一個(gè)英文等于兩個(gè)字節(jié),一個(gè)中文(含繁體)等于兩個(gè)字節(jié)。中文標(biāo)點(diǎn)占兩個(gè)字節(jié),英文標(biāo)點(diǎn)。
擴(kuò)展資料:
UTF-8使用1~4字節(jié)為每個(gè)字符編碼:
1、一個(gè)US-ASCIl字符只需1字節(jié)編碼(Unicode范圍由U+0000~U+007F)。
2、帶有變音符號(hào)的拉丁文、希臘文、西里爾字母、亞美尼亞語(yǔ)、希伯來(lái)文、阿拉伯文、敘利亞文等字母則需要2字節(jié)編碼(Unicode范圍由U+0080~U+07FF)。
3、其他語(yǔ)言的字符(包括中日韓文字、東南亞文字、中東文字等)包含了大部分常用字,使用3字節(jié)編碼。
4、其他極少使用的語(yǔ)言字符使用4字節(jié)編碼。