American ASCII编码 (American Standard Code for Information Interchange,美国信息互换标准代码) China gbk编码 通称他们叫做 “DBCS“(Double Byte Charecter Set 双字节字符集) 统一 Unicode 统一码.万国码 utf-8 互联网上使用最广的一种unicode的实现方式,为传输而设计的编码.特点:变长编码方式.统一无
Java中,可以用\uXXXX表示Unicode字符,例如String s = "\u00X1";XXXX必须为4位,因此码点为U+1D546的字符,需要用两个编码单元表示,例如String t = "\uD835\uDD46"; 而如果直接写为"\u1D546",则表示"\u1D54"和"6"这两个字符. 大部分字符串,length与codePointCount这两个值相等.一些特殊字符则不等.例如U+1