PinyinUtil
import java.util.HashSet;
import java.util.Set;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
import java.util.regex.PatternSyntaxException;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;
import net.sourceforge.pinyin4j.PinyinHelper;
import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;
import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;
import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;
import net.sourceforge.pinyin4j.format.HanyuPinyinVCharType;
import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination;
/**
* 拼音使用工具类 </br> 功能: 输入汉字取得拼音。 <br>
* 使用Pinyin4j.jar
*
*/
public class PinyinUtil {
/**
* 获取中文汉字拼音 默认输出
*
* @param chinese
* 中文汉字
* @return
*/
public static String getPinyin(String chinese) {
return getPinyinZh_CN(convertStringByChinese(chinese));
}
/**
* 拼音大写输出
*
* @param chinese
* 中文汉字
* @return
*/
public static String getPinyinToUpperCase(String chinese) {
return getPinyinZh_CN(convertStringByChinese(chinese)).toUpperCase();
}
/**
* 拼音小写输出
*
* @param chinese
* 中文汉字
* @return
*/
public static String getPinyinToLowerCase(String chinese) {
return getPinyinZh_CN(convertStringByChinese(chinese)).toLowerCase();
}
/**
* 首字母大写输出
*
* @param chinese
* 中文汉字
* @return
*/
public static String getPinyinFirstToUpperCase(String chinese) {
return getPinyin(chinese);
}
/**
* Default Format 默认输出格式 小或大写、 没有音调数字、u显示
*
* @param isLowerCase
* 是否小写
* @return
*/
private static HanyuPinyinOutputFormat getDefaultFormat() {
HanyuPinyinOutputFormat format = new HanyuPinyinOutputFormat();
format.setCaseType(HanyuPinyinCaseType.LOWERCASE);// 小写
format.setToneType(HanyuPinyinToneType.WITHOUT_TONE);// 没有音调数字
format.setVCharType(HanyuPinyinVCharType.WITH_U_AND_COLON);// u显示
return format;
}
/**
* 字符集转换
*
* @param chinese
* 中文汉字
* @throws BadHanyuPinyinOutputFormatCombination
*/
private static Set<String> convertStringByChinese(String chinese) {
char[] chars = chinese.toCharArray();
if (chinese != null && !chinese.trim().equalsIgnoreCase("")) {
char[] srcChar = chinese.toCharArray();
String[][] temp = new String[chinese.length()][];
for (int i = 0; i < srcChar.length; i++) {
char c = srcChar[i];
// 是中文(a-z、A-Z)转换拼音
if (String.valueOf(c).matches("[\\u4E00-\\u9FA5]+")
|| String.valueOf(c).matches("[\\u3007]")) {
try {
temp[i] = PinyinHelper.toHanyuPinyinStringArray(chars[i], getDefaultFormat());
} catch (BadHanyuPinyinOutputFormatCombination e) {
e.printStackTrace();
}
} else {
temp[i] = new String[] { String.valueOf(srcChar[i]) };
}
}
String[] pingyinArray = exchange(temp);
Set<String> pinyin = new HashSet<String>();
for (int i = 0; i < pingyinArray.length; i++) {
pinyin.add(pingyinArray[i]);
}
return pinyin;
}
return null;
}
/**
* 递归
*
* @param strJaggedArray
* @return
*/
private static String[] exchange(String[][] strJaggedArray) {
String[][] temp = doExchange(strJaggedArray);
return temp[0];
}
/**
* 递归
*
* @param strJaggedArray
* @return
*/
private static String[][] doExchange(String[][] strJaggedArray) {
int len = strJaggedArray.length;
if (len >= 2) {
int len1 = strJaggedArray[0].length;
int len2 = strJaggedArray[1].length;
int newlen = len1 * len2;
String[] temp = new String[newlen];
int index = 0;
for (int i = 0; i < len1; i++) {
for (int j = 0; j < len2; j++) {
temp[index] = capitalize(strJaggedArray[0][i])
+ capitalize(strJaggedArray[1][j]);
index++;
}
}
String[][] newArray = new String[len - 1][];
for (int i = 2; i < len; i++) {
newArray[i - 1] = strJaggedArray[i];
}
newArray[0] = temp;
return doExchange(newArray);
} else {
return strJaggedArray;
}
}
/**
* 首字母大写
*
* @param s
* @return
*/
private static String capitalize(String s) {
char[] ch = s.toCharArray();
if (ch != null && ch.length > 0) {
if (ch[0] >= 'a' && ch[0] <= 'z')
ch[0] = (char) (ch[0] - 32);
}
return new String(ch);
}
/**
* 字符串集合转换字符串(逗号分隔)
*
* @param stringSet
* @return
*/
private static String getPinyinZh_CN(Set<String> stringSet) {
StringBuilder str = new StringBuilder();
int i = 0;
for (String s : stringSet) {
if (i == stringSet.size() - 1) {
str.append(s);
} else {
str.append(s + ",");
}
i++;
}
return str.toString();
}
/**
* 返回中文的首字母
*
* @param chinese
* @return
*/
public static String getPinYinHeadChar(String chinese) {
StringBuffer pinyin = new StringBuffer();
if (chinese != null && !chinese.trim().equalsIgnoreCase("")) {
for (int j = 0; j < chinese.length(); j++) {
char word = chinese.charAt(j);
String[] pinyinArray = PinyinHelper.toHanyuPinyinStringArray(word);
if (pinyinArray != null) {
pinyin.append(pinyinArray[0].charAt(0));
} else {
pinyin.append(word);
}
}
}
return pinyin.toString();
}
/**
* 去除特殊字符
* @param cnStr
* @return
*/
public static String strFilter(String str) throws PatternSyntaxException {
// 只允许字母和数字
// String regEx = "[^a-zA-Z0-9]";
// 清除掉所有特殊字符
String regEx="[`~!@#$%^&*()+=|{}':;',\\[\\].<>/?~!@#¥%……&*()——+|{}【】‘;:”“’。,、?\"]";
Pattern p = Pattern.compile(regEx);
Matcher m = p.matcher(str);
return m.replaceAll("").trim();
}
/**
* 返回中文的首字母并过滤特殊字符输出
* @param chinese
* @return
*/
public static String getPinYinHeadCharFilter(String chinese) {
return strFilter(getPinYinHeadChar(chinese));
}
/**
* Test 测试
*
* @param args
*/
public static void main(String[] args) throws Exception{
HanyuPinyinOutputFormat format = new HanyuPinyinOutputFormat();
// UPPERCASE:大写 (ZHONG)
// LOWERCASE:小写 (zhong)
format.setCaseType(HanyuPinyinCaseType.LOWERCASE);
// WITHOUT_TONE:无音标 (zhong)
// WITH_TONE_NUMBER:1-4数字表示英标 (zhong4)
// WITH_TONE_MARK:直接用音标符(必须WITH_U_UNICODE否则异常) (zhòng)
format.setToneType(HanyuPinyinToneType.WITH_TONE_MARK);
// WITH_V:用v表示ü (nv)
// WITH_U_AND_COLON:用"u:"表示ü (nu:)
// WITH_U_UNICODE:直接用ü (nü)
format.setVCharType(HanyuPinyinVCharType.WITH_U_UNICODE);
char word = '区';
String[] pinyinArray = PinyinHelper.toHanyuPinyinStringArray(word,format);
for(String e:pinyinArray){
System.out.println(e);//shou
}
// Logger logger = LoggerFactory.getLogger(PinyinUtil.class);
// logger.info(pinyinArray.toString() );
// String str = "〇的输¥¥#s,ldsa";
// logger.info("小写输出:" + getPinyinToLowerCase(str));
// logger.info("大写输出:" + getPinyinToUpperCase(str));
// logger.info("首字母大写输出:" + getPinyinFirstToUpperCase(str));
// logger.info("返回中文的首字母输出:" + getPinYinHeadChar(str));
// logger.info("返回中文的首字母并过滤特殊字符输出:" + getPinYinHeadCharFilter(str));
}
}
PinyinUtil的更多相关文章
- 拼音操作工具类 - PinyinUtil.java
拼音操作工具类,提供字符串转换成拼音数组.汉字转换成拼音.取汉字的首字母等方法. 源码如下:(点击下载 -PinyinUtil.java.pinyin4j-2.5.0.jar ) import net ...
- java加拼音的工具 pinyinutil
<!--汉字转拼音--> <dependency> <groupId>com.belerweb</groupId> <artifactId> ...
- JavaScript 汉字与拼音互转终极方案 附JS拼音输入法
转:http://www.codeceo.com/article/javascript-pinyin.html 前言 网上关于JS实现汉字和拼音互转的文章很多,但是比较杂乱,都是互相抄来抄去,而且有的 ...
- 【干货】JS版汉字与拼音互转终极方案,附简单的JS拼音输入法
前言 网上关于JS实现汉字和拼音互转的文章很多,但是比较杂乱,都是互相抄来抄去,而且有的不支持多音字,有的不支持声调,有的字典文件太大,还比如有时候我仅仅是需要获取汉字拼音首字母却要引入200kb的字 ...
- java 中文转化为拼音
依赖架包:pinyin4j.jar package net.jeeshop.core.util; import net.sourceforge.pinyin4j.PinyinHelper; impor ...
- java 汉语转拼音(全拼,首字母)
import java.util.*; import net.sourceforge.pinyin4j.PinyinHelper;import net.sourceforge.pinyin4j.for ...
- java中汉字自动转换成拼音
java中汉字自动转换成拼音 1.需要下载jar包 pinyin4j.2.5.0.jar ,加入到WEB-INF下的lib里边,右键add to bulid path. 2.[代码]PinYinUti ...
- pinyin4j使用示例
pinyin4j的主页:http://pinyin4j.sourceforge.net/pinyin4j能够根据中文字符获取其对应的拼音,而且拼音的格式可以定制pinyin4j是一个支持将中文转换到拼 ...
- java 汉字转拼音
先决条件: pinyin4j.jar(Pinyin4j是一个流行的Java库,支持中文字符和拼音之间的转换.拼音输出格式可以定制.) 下载地址:http://pan.baidu.com/share/l ...
随机推荐
- iOS开发-- 开发中遇到的问题汇总
1. CUICatalog: Invalid asset name supplied: 今天写了加载图片,默认图片写的是[UIImage imageNamed:@""],之后就报下 ...
- QT开发环境安装配置教程
QT开发环境安装配置教程 分类: QT2012-11-29 23:31 35366人阅读 评论(12) 收藏 举报 Linux版的直接在ubutnu软件中心输入QT,安装响应的Designer,Cre ...
- JS 对象的深拷贝和浅拷贝
转载于原文:https://www.cnblogs.com/dabingqi/p/8502932.html 这篇文章是转载于上面的链接地址,觉得写的非常好,所以收藏了,感谢原创作者的分享. 浅拷贝和深 ...
- I - Crossing River
A group of N people wishes to go across a river with only one boat, which can at most carry two pers ...
- JVM优化之 -Xss -Xms -Xmx -Xmn 参数设置
XmnXmsXmxXss有什么区别Xmn.Xms.Xmx.Xss都是JVM对内存的配置参数,我们可以根据不同需要区修改这些参数,以达到运行程序的最好效果. -Xms 堆内存的最小大小,默认为物理内存的 ...
- [转] - Spark排错与优化
Spark排错与优化 http://blog.csdn.net/lsshlsw/article/details/49155087 一. 运维 1. Master挂掉,standby重启也失效 Mast ...
- Mongodb----整理
----------------------------------------------------------------------------------mongodb基本操作------- ...
- day4 四、流程控制之if判断、while循环、for循环
一.if判断 1.语法一: if 条件: 条件成立时执行的子代码块 代码1 代码2 代码3 示例: sex='female' age= is_beautiful=True and age < a ...
- linux中使用ps -ef
常操作linux系统的都会用到:ps -ef 命令,是一个非常强大的进程查看命令. 在训练模型中使用python,那么我会要看这个python相关的进程,可以使用如下命令”: ps -ef | fgr ...
- ModelDriven & Preparable 接口
一. Preparable接口 1.有prepare()方法,实现该接口的action在执行时,首先执行该方法,用于进行一些预处理.2.创建prepareXXX方法,则在执行XXX方法前,将先执行pr ...