1、中文漢字的編碼范圍:[u4e00-u9fa5](java相關(guān)視頻教程推薦:java視頻教程)
下面的方法判斷一個(gè)字符是不是漢字
//如果是一個(gè)漢字返回true,否則返回falsepublic static boolean checkCharCN(char c){ String s = String.valueOf(c); String regex = "[u4e00-u9fa5]"; Pattern p = Pattern.compile(regex); Matcher m = p.matcher(s); return m.matches(); }
Java用的是Unicode 編碼char 型變量的范圍是0-65535 無符號(hào)的值,可以表示 65536個(gè)字符,基本上地球上的字符可被全部包括了
漢字基本集中在[19968,40869]之間,共有20901個(gè)漢字
unicode編碼范圍:
漢字:[0x4e00,0x9fa5](或十進(jìn)制[19968,40869])
數(shù)字:[0x30,0x39](或十進(jìn)制[48, 57])
小寫字母:[0x61,0x7a](或十進(jìn)制[97, 122])
大寫字母:[0x41,0x5a](或十進(jìn)制[65, 90])