繁简转换

HanLP几乎实现了所有我们需要的繁简转换方式,并且已经封装到了HanLP中,使得我们可以轻松的使用,而分词器中已经默认支持多种繁简格式或者混合。这里我们不再做过多描述。

说明

·HanLP能够识别简繁分歧词,比如打印机=印表機。许多简繁转换工具不能区分“以后”“皇后”中的两个“后”字,HanLP可以。

算法详解

·《汉字转拼音与简繁转换的Java实现》——请查阅此文

  1. from pyhanlp import *
  2. # 繁简转化
  3. print(HanLP.convertToTraditionalChinese("“以后等你当上皇后,就能买草莓庆祝了”。发现一根白头发"))
  4. print(HanLP.convertToSimplifiedChinese("憑藉筆記簿型電腦寫程式HanLP"))
  5. # 简体转台湾繁体
  6. print(HanLP.s2tw("hankcs在台湾写代码"))
  7. # 台湾繁体转简体
  8. print(HanLP.tw2s("hankcs在臺灣寫程式碼"))
  9. # 简体转香港繁体
  10. print(HanLP.s2hk("hankcs在香港写代码"))
  11. # 香港繁体转简体
  12. print(HanLP.hk2s("hankcs在香港寫代碼"))
  13. # 香港繁体转台湾繁体
  14. print(HanLP.hk2tw("hankcs在臺灣寫代碼"))
  15. # 台湾繁体转香港繁体
  16. print(HanLP.tw2hk("hankcs在香港寫程式碼"))

17.

18.# 香港/台湾繁体和HanLP标准繁体的互转

19.print(HanLP.t2tw("hankcs在臺灣寫代碼"))

20.print(HanLP.t2hk("hankcs在臺灣寫代碼"))

21.

22.print(HanLP.tw2t("hankcs在臺灣寫程式碼"))

23.print(HanLP.hk2t("hankcs在台灣寫代碼"))

1.「以後等你當上皇后,就能買草莓慶祝了」。發現一根白頭髮

2.凭借笔记本电脑写程序HanLP

3.hankcs在臺灣寫程式碼

4.hankcs在台湾写代码

5.hankcs在香港寫代碼

6.hankcs在香港写代码

7.hankcs在臺灣寫程式碼

8.hankcs在香港寫代碼

9.hankcs在臺灣寫程式碼

10.hankcs在台灣寫代碼

11.hankcs在臺灣寫代碼

12.hankcs在臺灣寫代碼

---------------------

作者:Font Tian

汉语言处理工具pyhanlp的简繁转换的更多相关文章

  1. 利用 OpenCC 工具进行文字的简繁转换

    前言 近日在公司遇到一个需求,因为准备要推出海外版产品,所以需要将所有的简体文字转换为繁体文字.一开始是改了表面的文字,但是后面发现很多提示语也需要去改,所以找了一个工具去对所有 .m 文件进行批量文 ...

  2. js搞定网页的简繁转换

    对网页进行简繁字体转换的方法一般有两种:一是使用<简繁通>这样的专业软件,另外一种是制作两套版本的网页.显然,这两种方法都较为麻烦,而且专业软件一般不能用于免费的空间.笔者在这里给大家提供 ...

  3. 汉语言处理工具pyhanlp的拼音转换与字符正则化

    汉字转拼音 HanLP中的汉字转拼音功能也十分的强大. 说明: l HanLP不仅支持基础的汉字转拼音,还支持声母.韵母.音调.音标和输入法首字母首声母功能. l HanLP能够识别多音字,也能给繁体 ...

  4. [原创]使用OPENCC库进行简繁转换(C++代码)

    最近公司有一款游戏产品,字库存在问题,希望全自动进行简繁同屏自动转换的行为,减少工作量. 所以自己使用了WINDOWS自带的一些转换函数,但发现大量字出现异常,无法转换(测试iconv也发现无法转换) ...

  5. Office WORD如何简繁转换

    选中要转换的文字,工具-语言,中文简繁转换.

  6. SQL简繁转换函数

    declare @jall nvarchar(4000),@fall nvarchar(4000) select @jall=N'啊阿埃挨哎唉哀皑癌蔼矮艾碍爱隘鞍氨安俺按暗岸胺案肮昂盎凹敖熬翱袄傲奥懊 ...

  7. javascript 简繁转换

    js 简繁转换 function copy(ob) { var obj=findObj(ob); if (obj) { obj.select();js=obj.createTextRange();js ...

  8. Elasticsearch高级搜索排序( 中文+拼音+首字母+简繁转换+特殊符号过滤)

    一.先摆需求: 1.中文搜索.英文搜索.中英混搜   如:"南京东路","cafe 南京东路店" 2.全拼搜索.首字母搜索.中文+全拼.中文+首字母混搜   如 ...

  9. HanLP极致简繁转换详细讲解

    HanLP极致简繁转换详细讲解 作者: hankcs(大快高级研究员 hanlp项目负责人) 谈起简繁转换,许多人以为是小意思,按字转换就行了.事实上,汉语历史悠久,地域复杂,发展至今在字符级别存在“ ...

随机推荐

  1. legend2---开发日志10(ajax请求的方法是否同样会执行base控制器里面的方法)

    legend2---开发日志10(ajax请求的方法是否同样会执行base控制器里面的方法) 一.总结 一句话总结:会执行的,所以写base控制器里面的方法要注意,base控制器里面的方法要以查数据为 ...

  2. 『TensorFlow』降噪自编码器设计

    背景简介 TensorFlow实现讲解 设计新思路: 1.使用类来记录整个网络: 使用_init_()属性来记录 网络超参数 & 网络框架 & 训练过程 使用一个隐式方法初始化网络参数 ...

  3. jquery获取选中值

    1.获取一组radio被选中项的值:var item = $('input[name=items][checked]').val(); 2.获取select被选中项的文本 :var item = $( ...

  4. sin n次方 x 的降幂公式

    A(n) = ∫ sinⁿx dx= ∫ sinⁿ⁻¹xsinx dx= - ∫ sinⁿ⁻¹x d(cosx)= - sinⁿ⁻¹xcosx + ∫ cosx • d(sinⁿ⁻¹)= - sinⁿ ...

  5. webassembly

    为什么需要 WebAssembly 自从 JavaScript 诞生起到现在已经变成最流行的编程语言,这背后正是 Web 的发展所推动的.Web 应用变得更多更复杂,但这也渐渐暴露出了 JavaScr ...

  6. ubuntu1604使用之旅——网络配置

    首先是虚拟机的设置是如图所示,桥接模式. 1.ifconfig,下图所示,ens32是本机的网卡,记住这个,有用. 2.输入:sudo gedit /etc/network/interfaces 默认 ...

  7. redis 集群常用命令

    systemctl start redis.service #redis 启动redis-server /etc/redis.conf #redis 加载配置文件启动 redis-cli -h 192 ...

  8. main函数

    class Main { public static void main(String[] args) //new String(0) { System.out.println(args); // [ ...

  9. .NET并行计算和并发3.2-多线程调用Invoke

    以下这个例子是用一个后台线程执行计算逻辑,这样不影响前台界面操作,也就是说 可以在前台UI界面执行其他操作. 重点是新线程中,调用了一个委托方法,这个方法是需要填充数据到前台控件,因为 前台控件是在原 ...

  10. 远程链接 aws Windows Server 2016 Base Nano

    第一次接触Windows Server 2016 Base Nano,平时工作中或者自己私下使用win的服务器都是带桌面版本的 而这次在aws一不小心开了一台Nano服务,刚开始我都不知道这个是什么玩 ...