Java 字符编码(一)Unicode 字符编码 Unicode(http://www.unicode.org/versions/#TUS_Latest_Version) 是一个编码方案,说白了希望给世界上每一种文字系统的每一个字符,都分配一个唯一的整数,这样就不可能有任何冲突了. 一.字符编码规范 1.1 ASCII(American Standard Code for Information Interchange) 美国信息交换标准代码,这是计算机上最早使用的通用的编码方案.那个时候计算机
firebug 打UTF8 字符: var res = ""; for(var i=0x80;i< 0xff ;i++){ res += i.toString(16) + "\t:" + String.fromCharCode( i ) +"\t\t" ; } res 或: var res = ""; document.clear();for(var i=0x2b0;i< 0x2ff ;i++){ res +=
In [18]: c = '你好' In [20]: d = c.encode('unicode_escape') In [21]: d Out[21]: b'\\u4f60\\u597d' In [23]: e = d.decode('utf-8') In [24]: e Out[24]: '\\u4f60\\u597d' In [25]: type(e) Out[25]: str In [26]: f = e.encode('utf-8').decode('unicode_escape')