Unicode编码,基础:它为世界上所有的文字系统的每个字符单位分配一个唯一的整数,该整数介于0~1114111之间,在Unicode术语中称为代码点(code point). 和其它字符编码几乎没有任何不同(例如ASCII). 不同在于ASCII将每个索引映射为唯一的二进制表示,但Unicode允许多个不同二进制编码的代码点. 不同的编码在要求存储的字符串数量和操作速度之间进行权衡. 目前最流行的Unicode编码方式有:UTF-8,UTF-16,UTF-32. Unicode根据历史的数据,…