最近要使用中科院计算所的关键词工具NLPIR,用java调用,在windows下测试后放到linux下跑,就发现会有乱码. windows下默认是GBK,linux下是utf-8,因此在意料之中(尽管最后发现其实不是平台的问题). 除此之外对于编码问题,一直不清楚,不知道这是工具问题还是平台问题,因此楼主一点一点排查,学到了一些编码的知识,备忘一下- 设置linux下的中文编码包 首先,查看linux设置的默认编码方式,看看是不是因为缺少中文编码包. [root]# locale locale是…