一.编码问题 utf-8编码中,一个中文占3个字节,一个英文占1个字节:gbk编码中,一个中文占2个字节,一个英文占1个字节. Java是双字节编码,为utf-16be编码,是说一个字符(无论中文还是英文,都占用2个字节).因此如果这么问:Java字符串中一个字符可以放一个中文吗?是可以的! 如果一直某个字节序列的编码方式,当我们想将它还原成字符串时,应明确指定其编码格式,否则会出现乱码. 文本文件就是字节序列,可以是任意编码的字节序列.如果在中文机器上,直接创建文本文件,该文本文件只认识ANS