PinyinUtil
import java.util.HashSet;
import java.util.Set;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
import java.util.regex.PatternSyntaxException;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;
import net.sourceforge.pinyin4j.PinyinHelper;
import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;
import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;
import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;
import net.sourceforge.pinyin4j.format.HanyuPinyinVCharType;
import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination;
/**
* 拼音使用工具类 </br> 功能: 输入汉字取得拼音。 <br>
* 使用Pinyin4j.jar
*
*/
public class PinyinUtil {
/**
* 获取中文汉字拼音 默认输出
*
* @param chinese
* 中文汉字
* @return
*/
public static String getPinyin(String chinese) {
return getPinyinZh_CN(convertStringByChinese(chinese));
}
/**
* 拼音大写输出
*
* @param chinese
* 中文汉字
* @return
*/
public static String getPinyinToUpperCase(String chinese) {
return getPinyinZh_CN(convertStringByChinese(chinese)).toUpperCase();
}
/**
* 拼音小写输出
*
* @param chinese
* 中文汉字
* @return
*/
public static String getPinyinToLowerCase(String chinese) {
return getPinyinZh_CN(convertStringByChinese(chinese)).toLowerCase();
}
/**
* 首字母大写输出
*
* @param chinese
* 中文汉字
* @return
*/
public static String getPinyinFirstToUpperCase(String chinese) {
return getPinyin(chinese);
}
/**
* Default Format 默认输出格式 小或大写、 没有音调数字、u显示
*
* @param isLowerCase
* 是否小写
* @return
*/
private static HanyuPinyinOutputFormat getDefaultFormat() {
HanyuPinyinOutputFormat format = new HanyuPinyinOutputFormat();
format.setCaseType(HanyuPinyinCaseType.LOWERCASE);// 小写
format.setToneType(HanyuPinyinToneType.WITHOUT_TONE);// 没有音调数字
format.setVCharType(HanyuPinyinVCharType.WITH_U_AND_COLON);// u显示
return format;
}
/**
* 字符集转换
*
* @param chinese
* 中文汉字
* @throws BadHanyuPinyinOutputFormatCombination
*/
private static Set<String> convertStringByChinese(String chinese) {
char[] chars = chinese.toCharArray();
if (chinese != null && !chinese.trim().equalsIgnoreCase("")) {
char[] srcChar = chinese.toCharArray();
String[][] temp = new String[chinese.length()][];
for (int i = 0; i < srcChar.length; i++) {
char c = srcChar[i];
// 是中文(a-z、A-Z)转换拼音
if (String.valueOf(c).matches("[\\u4E00-\\u9FA5]+")
|| String.valueOf(c).matches("[\\u3007]")) {
try {
temp[i] = PinyinHelper.toHanyuPinyinStringArray(chars[i], getDefaultFormat());
} catch (BadHanyuPinyinOutputFormatCombination e) {
e.printStackTrace();
}
} else {
temp[i] = new String[] { String.valueOf(srcChar[i]) };
}
}
String[] pingyinArray = exchange(temp);
Set<String> pinyin = new HashSet<String>();
for (int i = 0; i < pingyinArray.length; i++) {
pinyin.add(pingyinArray[i]);
}
return pinyin;
}
return null;
}
/**
* 递归
*
* @param strJaggedArray
* @return
*/
private static String[] exchange(String[][] strJaggedArray) {
String[][] temp = doExchange(strJaggedArray);
return temp[0];
}
/**
* 递归
*
* @param strJaggedArray
* @return
*/
private static String[][] doExchange(String[][] strJaggedArray) {
int len = strJaggedArray.length;
if (len >= 2) {
int len1 = strJaggedArray[0].length;
int len2 = strJaggedArray[1].length;
int newlen = len1 * len2;
String[] temp = new String[newlen];
int index = 0;
for (int i = 0; i < len1; i++) {
for (int j = 0; j < len2; j++) {
temp[index] = capitalize(strJaggedArray[0][i])
+ capitalize(strJaggedArray[1][j]);
index++;
}
}
String[][] newArray = new String[len - 1][];
for (int i = 2; i < len; i++) {
newArray[i - 1] = strJaggedArray[i];
}
newArray[0] = temp;
return doExchange(newArray);
} else {
return strJaggedArray;
}
}
/**
* 首字母大写
*
* @param s
* @return
*/
private static String capitalize(String s) {
char[] ch = s.toCharArray();
if (ch != null && ch.length > 0) {
if (ch[0] >= 'a' && ch[0] <= 'z')
ch[0] = (char) (ch[0] - 32);
}
return new String(ch);
}
/**
* 字符串集合转换字符串(逗号分隔)
*
* @param stringSet
* @return
*/
private static String getPinyinZh_CN(Set<String> stringSet) {
StringBuilder str = new StringBuilder();
int i = 0;
for (String s : stringSet) {
if (i == stringSet.size() - 1) {
str.append(s);
} else {
str.append(s + ",");
}
i++;
}
return str.toString();
}
/**
* 返回中文的首字母
*
* @param chinese
* @return
*/
public static String getPinYinHeadChar(String chinese) {
StringBuffer pinyin = new StringBuffer();
if (chinese != null && !chinese.trim().equalsIgnoreCase("")) {
for (int j = 0; j < chinese.length(); j++) {
char word = chinese.charAt(j);
String[] pinyinArray = PinyinHelper.toHanyuPinyinStringArray(word);
if (pinyinArray != null) {
pinyin.append(pinyinArray[0].charAt(0));
} else {
pinyin.append(word);
}
}
}
return pinyin.toString();
}
/**
* 去除特殊字符
* @param cnStr
* @return
*/
public static String strFilter(String str) throws PatternSyntaxException {
// 只允许字母和数字
// String regEx = "[^a-zA-Z0-9]";
// 清除掉所有特殊字符
String regEx="[`~!@#$%^&*()+=|{}':;',\\[\\].<>/?~!@#¥%……&*()——+|{}【】‘;:”“’。,、?\"]";
Pattern p = Pattern.compile(regEx);
Matcher m = p.matcher(str);
return m.replaceAll("").trim();
}
/**
* 返回中文的首字母并过滤特殊字符输出
* @param chinese
* @return
*/
public static String getPinYinHeadCharFilter(String chinese) {
return strFilter(getPinYinHeadChar(chinese));
}
/**
* Test 测试
*
* @param args
*/
public static void main(String[] args) throws Exception{
HanyuPinyinOutputFormat format = new HanyuPinyinOutputFormat();
// UPPERCASE:大写 (ZHONG)
// LOWERCASE:小写 (zhong)
format.setCaseType(HanyuPinyinCaseType.LOWERCASE);
// WITHOUT_TONE:无音标 (zhong)
// WITH_TONE_NUMBER:1-4数字表示英标 (zhong4)
// WITH_TONE_MARK:直接用音标符(必须WITH_U_UNICODE否则异常) (zhòng)
format.setToneType(HanyuPinyinToneType.WITH_TONE_MARK);
// WITH_V:用v表示ü (nv)
// WITH_U_AND_COLON:用"u:"表示ü (nu:)
// WITH_U_UNICODE:直接用ü (nü)
format.setVCharType(HanyuPinyinVCharType.WITH_U_UNICODE);
char word = '区';
String[] pinyinArray = PinyinHelper.toHanyuPinyinStringArray(word,format);
for(String e:pinyinArray){
System.out.println(e);//shou
}
// Logger logger = LoggerFactory.getLogger(PinyinUtil.class);
// logger.info(pinyinArray.toString() );
// String str = "〇的输¥¥#s,ldsa";
// logger.info("小写输出:" + getPinyinToLowerCase(str));
// logger.info("大写输出:" + getPinyinToUpperCase(str));
// logger.info("首字母大写输出:" + getPinyinFirstToUpperCase(str));
// logger.info("返回中文的首字母输出:" + getPinYinHeadChar(str));
// logger.info("返回中文的首字母并过滤特殊字符输出:" + getPinYinHeadCharFilter(str));
}
}
PinyinUtil的更多相关文章
- 拼音操作工具类 - PinyinUtil.java
拼音操作工具类,提供字符串转换成拼音数组.汉字转换成拼音.取汉字的首字母等方法. 源码如下:(点击下载 -PinyinUtil.java.pinyin4j-2.5.0.jar ) import net ...
- java加拼音的工具 pinyinutil
<!--汉字转拼音--> <dependency> <groupId>com.belerweb</groupId> <artifactId> ...
- JavaScript 汉字与拼音互转终极方案 附JS拼音输入法
转:http://www.codeceo.com/article/javascript-pinyin.html 前言 网上关于JS实现汉字和拼音互转的文章很多,但是比较杂乱,都是互相抄来抄去,而且有的 ...
- 【干货】JS版汉字与拼音互转终极方案,附简单的JS拼音输入法
前言 网上关于JS实现汉字和拼音互转的文章很多,但是比较杂乱,都是互相抄来抄去,而且有的不支持多音字,有的不支持声调,有的字典文件太大,还比如有时候我仅仅是需要获取汉字拼音首字母却要引入200kb的字 ...
- java 中文转化为拼音
依赖架包:pinyin4j.jar package net.jeeshop.core.util; import net.sourceforge.pinyin4j.PinyinHelper; impor ...
- java 汉语转拼音(全拼,首字母)
import java.util.*; import net.sourceforge.pinyin4j.PinyinHelper;import net.sourceforge.pinyin4j.for ...
- java中汉字自动转换成拼音
java中汉字自动转换成拼音 1.需要下载jar包 pinyin4j.2.5.0.jar ,加入到WEB-INF下的lib里边,右键add to bulid path. 2.[代码]PinYinUti ...
- pinyin4j使用示例
pinyin4j的主页:http://pinyin4j.sourceforge.net/pinyin4j能够根据中文字符获取其对应的拼音,而且拼音的格式可以定制pinyin4j是一个支持将中文转换到拼 ...
- java 汉字转拼音
先决条件: pinyin4j.jar(Pinyin4j是一个流行的Java库,支持中文字符和拼音之间的转换.拼音输出格式可以定制.) 下载地址:http://pan.baidu.com/share/l ...
随机推荐
- CentOS7 设置软件镜像源
Linux拥有众多的发行版,每个发行版都有提供镜像,但是,在国内这些镜像的下载速度参差不齐,偶尔会有更新失败的情况. 网上众多推荐的镜像源为163的镜像,笔者通过一段时间的试用,发现某些小众带宽访问1 ...
- 使用mui.js实现下拉刷新
闲聊: 最近因公司项目需求,小颖需要写一些html5页面,方便公司IOS和Android给APP中嵌套使用,其中需要实现拉下刷新功能,其实就是调用了一下mui.js就可以啦嘻嘻,下面跟着小颖一起来看看 ...
- oracle相关的知识
01.表空间的创建与删除 Spool 目录 (把sql语句都记录在txt文件中)spool e:\xxx.txtSpool off 结束 SQL> --清除屏幕信息SQL> cle ...
- time时间模块
时间模块 和时间有关系的我们就要用到时间模块.在使用模块之前,应该首先导入这个模块. #常用方法 1.time.sleep(secs) (线程)推迟指定的时间运行.单位为秒. 2.time.time( ...
- informix数据库触发器的写法
虽然有各种数据库,但触发器的原理都是一样的,懂一种数据库的写法就可以了解其他的. 以前写过mysql数据库的触发器,这次写informix的,还顺带看了oracle的,除了语法上的不同,informi ...
- java整形数据和浮点型数据
在定义数据的时候,如果有不是整形的数据(单精度,双精度之类的),那么运算的时候要在其所在式子里的数据后面加上.0,否则会出现(1/2=0.1.0/2=0.5)的现象,比如如下代码 public cla ...
- 【RMAN】RMAN-05001: auxiliary filename conflicts with the target database
oracle 11.2.0.4 运行以下脚本,使用活动数据库复制技术创建dataguard备库报错rman-005001: run{ duplicate target database for sta ...
- 使用hive分析nginx访问日志方法
以下案例是使用hive分析nginx的访问日志案例,其中字段分隔通过正则表达式匹配,具体步骤如下: 日志格式: 192.168.5.139 - - [08/Jun/2017:17:09:12 +080 ...
- 开启spark日志聚集功能
spark监控应用方式: 1)在运行过程中可以通过web Ui:4040端口进行监控 2)任务运行完成想要监控spark,需要启动日志聚集功能 开启日志聚集功能方法: 编辑conf/spark-env ...
- kubenets installation--ranchor-mesos
[kube-proxy]http://www.cnblogs.com/xuxinkun/p/5799986.html [flannel] 安装Flannel [root@master ~]# cd ~ ...