1、中文漢字的編碼范圍:[u4e00-u9fa5](java相關(guān)視頻教程推薦:java視頻教程)
下面的方法判斷一個字符是不是漢字
//如果是一個漢字返回true,否則返回falsepublic static boolean checkCharCN(char c){ String s = String.valueOf(c); String regex = "[u4e00-u9fa5]"; Pattern p = Pattern.compile(regex); Matcher m = p.matcher(s); return m.matches(); }
Java用的是Unicode 編碼char 型變量的范圍是0-65535 無符號的值,可以表示 65536個字符,基本上地球上的字符可被全部包括了
漢字基本集中在[19968,40869]之間,共有20901個漢字
unicode編碼范圍:
漢字:[0x4e00,0x9fa5](或十進制[19968,40869])
數(shù)字:[0x30,0x39](或十進制[48, 57])
小寫字母:[0x61,0x7a](或十進制[97, 122])
大寫字母:[0x41,0x5a](或十進制[65, 90])