在mysql中,一個(gè)中文漢字所占的字節(jié)數(shù)與編碼格式有關(guān):如果是GBK編碼,則一個(gè)中文漢字占2個(gè)字節(jié);如果是UTF8編碼,則一個(gè)中文漢字占3個(gè)字節(jié),而英文字母占1字節(jié)。
mysql里中文占多少個(gè)字節(jié)?
1. 一個(gè)中文漢字占多少字節(jié)與編碼有關(guān):
-
UTF8:一個(gè)中文漢字=3個(gè)字節(jié)
-
GBK:一個(gè)中文漢字=2個(gè)字節(jié)
utf-8, 英文字母1字節(jié)
2.varchar(n)能存儲(chǔ)幾個(gè)漢字?
varchar(n)表示n個(gè)字符,無(wú)論漢字和英文,Mysql都能存入n個(gè)字符,僅是實(shí)際字節(jié)長(zhǎng)度有所區(qū)別
3.MySQL怎么檢查長(zhǎng)度(占的字節(jié)數(shù))?
可用SQL語(yǔ)言中l(wèi)ength函數(shù):
select LENGTH(fieldname) from tablename
說(shuō)明:
UTF-8:Unicode Transformation Format-8bit,允許含BOM,但通常不含BOM。是用以解決國(guó)際上字符的一種多字節(jié)編碼,它對(duì)英文使用8位(即一個(gè)字節(jié)),中文使用24為(三個(gè)字節(jié))來(lái)編碼。UTF-8包含全世界所有國(guó)家需要用到的字符,是國(guó)際編碼,通用性強(qiáng)。UTF-8編碼的文字可以在各國(guó)支持UTF8字符集的瀏覽器上顯示。如,如果是UTF8編碼,則在外國(guó)人的英文IE上也能顯示中文,他們無(wú)需下載IE的中文語(yǔ)言支持包。
GBK 是國(guó)家標(biāo)準(zhǔn)GB2312基礎(chǔ)上擴(kuò)容后兼容GB2312的標(biāo)準(zhǔn)。GBK的文字編碼是用雙字節(jié)來(lái)表示的,即不論中、英文字符均使用雙字節(jié)來(lái)表示,為了區(qū)分中文,將其最高位都設(shè)定成1。GBK包含全部中文字符,是國(guó)家編碼,通用性比UTF8差,不過(guò)UTF8占用的數(shù)據(jù)庫(kù)比GBD大。
GBK、GB2312等與UTF8之間都必須通過(guò)Unicode編碼才能相互轉(zhuǎn)換:
GBK、GB2312-->Unicode-->UTF8
UTF8-->Unicode-->GBK、GB2312
-
GB2312是GBK的子集,GBK是GB18030的子集
-
GBK是包括中日韓字符的大字符集合
-
為了避免所有亂碼問(wèn)題,應(yīng)該采用UTF-8,將來(lái)要支持國(guó)際化也非常方便
-
UTF8可以看作是大字符集,它包含了大部分文字的編碼。
-
使用UTF8的一個(gè)好處是其他地區(qū)的用戶(如香港臺(tái)灣)無(wú)需安裝簡(jiǎn)體中文支持就能正常觀看你的文字而不會(huì)出現(xiàn)亂碼。
總結(jié):
gb2312是簡(jiǎn)體中文的碼
gbk支持簡(jiǎn)體中文及繁體中文
big5支持繁體中文
utf8支持幾乎所有字符
推薦教程:mysql視頻教程