ChineseUtils】的更多相关文章

这里获得汉字的拼音使用了pinyin4j这个插件,因为多音字的原因效果并不理想 /** * 获得汉字拼音 * @param name * @return */ @SuppressWarnings("deprecation") public static String getPiYin(String src) { HanyuPinyinOutputFormat outFormat = new HanyuPinyinOutputFormat(); outFormat.setCaseType…
参考http://www.52nlp.cn/%E4%B8%AD%E8%8B%B1%E6%96%87%E7%BB%B4%E5%9F%BA%E7%99%BE%E7%A7%91%E8%AF%AD%E6%96%99%E4%B8%8A%E7%9A%84word2vec%E5%AE%9E%E9%AA%8C 1.下周中文wiki资料zhwiki-latest-pages-articles.xml.bz2,1.5G左右 2.用 process_wiki.py处理XML压缩文件,将其转换为text文件,执行:py…
public class ChineseUtils { public static void main(String[] args) { String str = "中国 (1).jpg"; try { String str2 = new String(str.getBytes("iso-8859-1"),"iso-8859-1"); System.out.println(str2); System.out.println(isMessyCode…