汉字转拼音,TinyPinyin、Pinyin4j与JPinyin哪个库更快
1. 介绍
本文对TinyPinyin、Pinyin4j与JPinyin三个汉字转拼音库的用法、测试代码及转换的结果做一个简单的总结。
适用于Java和Android的快速、低内存占用的汉字转拼音库。
在Android项目中使用时,需要在module app下的build.gradle文件中添加依赖(下同):
1 compile 'com.github.promeg:tinypinyin:2.0.3'
2 compile 'com.github.promeg:tinypinyin-lexicons-android-cncity:2.0.3'
A copy of http://sourceforge.net/projects/pinyin4j, then deploy it to maven central repository.
compile 'com.belerweb:pinyin4j:2.5.0'
汉字转拼音的Java开源类库,在PinYin4j的功能基础上做了一些改进。
1 compile 'com.github.stuxuhai:jpinyin:1.1.8'
对于开源库,建议使用之前进入其主页了解当前实现的功能和版本号,毕竟别人的文章作为二手资料,目的在于抛砖引玉。
2. 测试
利用Android Studio建立Android项目PinyinTest来测试,具体的库依赖添加和布局文件可以下载后查看。
代码用Kotlin编写,入门文章:
应用运行初始界面:
界面由一个编辑框(TextInputEditText)和按钮(Button)组成,前者供编辑,后者被点击后开始拼音的转换。
为方便测试,在布局文件中设置编辑框默认文本为"真正的稳定,不是拿着固定不变的工资熬日子,世界每天都在变化,很多时候我们所谓的稳定,其实是自己的异想天开。真正的自由,是内心的自由,明白自己想走的路,明确自己想要的生活。做任何事情都要付出,怕,畏缩不前,什么都干不成。"。可以编辑成别的内容,但这段文字足以测试三个库转换的差异。
2.1 按钮点击事件绑定
"转换"按钮在布局文件中的id为convert_btn,Kotlin代码:
1 convert_btn.setOnClickListener {
2 var content: String = content_tiet.text.toString()
3 if (TextUtils.isEmpty(content)) {
4 Toast.makeText(this, "请输入内容,谢谢", Toast.LENGTH_SHORT).show()
5 } else {
6 tinypinyin(content)
7 pinyin4j(content)
8 jpinyin(content)
9 }
10 }
不用findViewById和注解,只需关注实现的功能,这就是Kotlin的简洁性。
Android库方法TextUtils.isEmpty()在参数为null或者length为0时会返回true,所以,编辑框如果没有内容则提示用户先输入;否则调用自定义的方法。
2.2 TinyPinyin转换
方法:
1 fun tinypinyin(content: String) {
2 val start_time: Long = System.currentTimeMillis()
3 val stringBuilder = StringBuilder()
4 stringBuilder.setLength(0)
5 for (c in content) {
6 stringBuilder.append(Pinyin.toPinyin(c))
7 }
8 val end_time: Long = System.currentTimeMillis()
9 Log.i("pinyintest", "tinypinyin time: " + + (end_time - start_time) + "ms")
10 Log.i("pinyintest", "tinypinyin content: " + stringBuilder.toString().toLowerCase())
11 }
主要代码Pinyin.toPinyin(c),如果字符c为汉字,返回对应的拼音;否则返回字符本身。
结果:
tinypinyin time: 9ms
tinypinyin content: zhenzhengdewending,bushinazhegudingbubiandegongziaorizi,shijiemeitiandouzaibianhua,henduoshihouwomensuoweidewending,qishishizijideyixiangtiankai。zhenzhengdeziyou,shineixindeziyou,mingbaizijixiangzoudelu,mingquezijixiangyaodeshenghuo。zuorenheshiqingdouyaofuchu,pa,weisuobuqian,shenmedouganbucheng。
2.3 Pinyin4j转换
方法:
1 fun pinyin4j(content: String) {
2 val start_time: Long = System.currentTimeMillis()
3 val stringBuilder = StringBuilder()
4 stringBuilder.setLength(0)
5 val hanyuPinyinOutputFormat = HanyuPinyinOutputFormat()
6 hanyuPinyinOutputFormat.toneType = HanyuPinyinToneType.WITHOUT_TONE
7 try {
8 for (c in content) {
9 val result = PinyinHelper.toHanyuPinyinStringArray(c, hanyuPinyinOutputFormat)
10 if (result != null) {
11 stringBuilder.append(result[0])
12 } else {
13 stringBuilder.append(c)
14 }
15 }
16 } catch (badHanyuPinyinOutputFormatCombination: BadHanyuPinyinOutputFormatCombination) {
17 badHanyuPinyinOutputFormatCombination.printStackTrace()
18 }
19 val end_time: Long = System.currentTimeMillis()
20 Log.i("pinyintest", "pinyin4j time: " + + (end_time - start_time) + "ms")
21 Log.i("pinyintest", "pinyin4j content: " + stringBuilder.toString().toLowerCase())
22 }
相比之下,Pinyin4j的使用要繁琐地多,如代码第5-6行先生成一个HanyuPinyinOutputFormat对象,用来指定是否需要声调等信息;还需为转换过程添加异常处理。
主要代码PinyinHelper.toHanyuPinyinStringArray(c, hanyuPinyinOutputFormat),如果c为汉字,返回的result非null,取[0]为拼音;否则result为null。因此,必须对结果进行判断,对不同情况做处理。
结果:
pinyin4j time: 209ms
pinyin4j content: zhenzhengdewending,bushinazhegudingbubiandegongziaorizi,shijiemeitiandouzaibianhua,henduoshihouwomensuoweidewending,qishishizijideyixiangtiankai。zhenzhengdeziyou,shineixindeziyou,mingbaizijixiangzoudelu,mingquezijixiangyaodeshenghuo。zuorenheshiqingdouyaofuchu,pa,weisuobuqian,shenmedouganbucheng。
2.4 JPinyin转换
方法:
1 fun jpinyin(content: String) {
2 val start_time: Long = System.currentTimeMillis()
3 val stringBuilder = StringBuilder()
4 stringBuilder.setLength(0)
5 stringBuilder.append(PinyinHelper.convertToPinyinString(content, "", PinyinFormat.WITHOUT_TONE))
6 val end_time: Long = System.currentTimeMillis()
7 Log.i("pinyintest", "jpinyin time: " + + (end_time - start_time) + "ms")
8 Log.i("pinyintest", "jpinyin content: " + stringBuilder.toString().toLowerCase())
9 }
主要代码PinyinHelper.convertToPinyinString(content, "", PinyinFormat.WITHOUT_TONE),从转换过程来看JPinyin是最方便的。因为它是直接对整个字串content进行处理,不用通过迭代操作每个字符。
同样地,第三个参数表示忽略声调,而第二个参数指定各个字符转换结果的分隔符,这里是空字串。
结果:
jpinyin time: 417ms
jpinyin content: zhenzhengdewending,bushinazhuogudingbubiandegongziaorizi,shijiemeitiandouzaibianhua,henduoshihouwomensuoweidewending,qishishizijideyixiangtiankai。zhenzhengdeziyou,shineixindeziyou,mingbaizijixiangzoudelu,mingquezijixiangyaodeshenghuo。zuorenheshiqingdouyaofuchu,pa,weisuobuqian,shenmedouganbucheng。
3. 总结
除了默认文本,还输入过其他字串进行测试,三个库转换所消耗的时间差异类似。JPinyin介绍是说在Pinyin4j的基础上做的改进,虽然调用方法上简单了,但是转换速度方面竟然要差一些。
因此,TinyPinyin是在三个库中比较理想的选择,如果进一步深入看它们的实现源码,就能明白为什么速度上有那么大的差异。
如果大家知道更好的汉字转拼音库,请推荐。
汉字转拼音,TinyPinyin、Pinyin4j与JPinyin哪个库更快的更多相关文章
- 汉字转拼音,TinyPinyin、Pinyin4j与JPinyin哪个库更快
1. 介绍 本文对TinyPinyin.Pinyin4j与JPinyin三个汉字转拼音库的用法.测试代码及转换的结果做一个简单的总结. TinyPinyin 适用于Java和Android的快速.低内 ...
- 汉字转拼音(pinyin4j)
1.引入依赖 <dependency> <groupId>pinyin4j.sourceforge.net</groupId> <artifactId> ...
- 汉字转拼音的Java类库——JPinyin
原文:http://blog.csdn.net/stuxuhai/article/details/8932715 [JPinyin主要特性]1.准确.完善的字库:Unicode编码从4E00-9FA5 ...
- JAVA实现汉字转换为拼音 pinyin4j/JPinyin
在项目中经常会遇到需求用户输入汉字后转换为拼音的场景,比如说通讯录,就会要求按名字首字符发音排序,如果自己写实现这方面的功能是个很好大的工程,还好网上有公开的第三方jar支持转换,结合网上很多前辈的代 ...
- 汉字转拼音的Java类库:JPinyin
JPinyin是一个汉字转拼音的Java开源类库,在PinYin4j的功能基础上做了一些改进. [JPinyin主要特性]1.准确.完善的字库:Unicode编码从4E00-9FA5范围及3007(〇 ...
- 用jpinyin实现汉字转拼音功能
一.简介 项目地址:https://github.com/stuxuhai/jpinyin JPinyin是一个汉字转拼音的Java开源类库,在PinYin4j的功能基础上做了一些改进. [JPiny ...
- 汉字转拼音开源工具包Jpinyin介绍
最近要实现一个根据词语得到词语对应拼音的功能,找到了Jpinyin这个开源工具包,使用下来发现它非常强大,完全满足我的需求,下面对它做一个简单的介绍,希望能够帮助到有需要的朋友. https://gi ...
- 最好用的汉字转拼音代码PinYin4Objc(PinYin4J的objc版本)
转:https://github.com/kimziv/PinYin4Objc 最好用的汉字转拼音代码PinYin4Objc(PinYin4J的objc版本)(更新到v1.1.1,增加block异步处 ...
- Java通过pinyin4j实现汉字转拼音
碰到个需求,需要按用户名字的首字母来排序.这就需要获取汉字对应的拼音了,突然就想起了pinyin4j这个jar包,于是就开始写了个汉字转拼音的工具类.在此记录一下,方便后续查阅 一.Pom依赖 ...
随机推荐
- Java生鲜电商平台-物流配送的设计与架构
Java生鲜电商平台-物流配送的设计与架构 说明:由于Java开源生鲜电商平台是属于自建物流系统,也就是买家下的单,需要公司派物流团队进行派送. 业务需求中买家的下单时间控制在: ...
- Java异常相关知识总结
异常: 概述:java程序运行过程中出现的错误 常见的异常: StackOverflowError ArrayIndexOutOfBoundsException NullPointerExceptio ...
- 转 echarts 的使用时遇到的坑 初始化和销毁,亲测有效!
纵观ECharts图表实例化的API,主要有一下几个相关的实例化方法: 1.setOption(Object option,{boolean = true} notMerge) 参数: 1).Obje ...
- 【AI测试】也许这有你想知道的人工智能 (AI) 测试--开篇
人工智能测试 什么是人工智能,人工智能是怎么测试的.可能是大家一开始最想了解的. 大家看图中关于人工智能的定义.通俗点来说呢,就是 让机器实现原来只有人类才能完成的任务:比如看懂照片,听懂说话,思考等 ...
- Centos7安装dubbo与zookeeper服务配置
目录 环境: 第一步:安装jdk,并且配置环境变量 1.解压jdk: 2.配置环境变量: 3.保存并使文件立即生效: 4.立即重启虚拟机,进行下面的安装 第二步:安装注册中心zookeeper 1.解 ...
- Python元组与字符串操作(8)——三数排序多种实现
练习 依次接收用户输入的3个数,排序后打印 1.转换int后,判断大小排序,使用分支结构完成 num1 = [] for i in range(3): num1.append(int(input('& ...
- CSS的四种基本选择器和四种高级选择器
做个快乐的搬运工:https://blog.csdn.net/DYD850804/article/details/80997251
- Rust第一次---centos 7下的安装,配置,测试
现在安装都依赖于网络,命令比较简单. 一,运行脚本,安装runstup 1,运行如下脚本: curl https://sh.rustup.rs -sSf | sh 2,输入默认项1,完成余下的安装 二 ...
- 201871010105-曹玉中《面向对象程序设计(java)》第十一周学习总结
201871010105-曹玉中<面向对象程序设计(java)>第十一周学习总结 项目 内容 <面向对象程序设计(java)> https://www.cnblogs.com/ ...
- Leetcode148-Sort_List
Sort_List 在LeetCode 里面,因为只有归并排序的时间复杂度为O(1),所以快速排序用不了,前面两个都没用直接看最后一个归并排序. 冒泡排序(超时了) public ListNode s ...