【转】汉语转拼音之pinyin4j
汉字转成拼音如果自己实现起来有点麻烦,主要是怕有些汉字转不了,所以就准备使用一个开源的工具Pinyin4j.
pinyin4j是一个支持将中文转换到拼音的Java开源类库,pinyin4j能够根据中文字符获取其对应的拼音,而且拼音的格式可以定制。pinyin4j的主页:http://pinyin4j.sourceforge.net/
1. 支持简体中文和繁体中文字符;
2. 支持转换到汉语拼音,通用拼音, 威妥玛拼音(威玛拼法), 注音符号第二式, 耶鲁拼法和国语罗马字;
3. 支持多音字,即可以获取一个中文字符的多种发音;
4. 支持多种字符串输出格式,比如支持Unicode格式的字符ü和声调符号(阴平 "ˉ",阳平"ˊ",上声"ˇ",去声"ˋ")的输出。
为了方便大家使用,我将源文件和jar包一并放上来了,欢迎大家下载。
废话少说,下面是我建立的一个通用类,有什么不足的地方希望大家指正。
package
com.xyj.com.tool.util;
![]()
import
net.sourceforge.pinyin4j.PinyinHelper;
import
net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;
import
net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;
import
net.sourceforge.pinyin4j.format.HanyuPinyinToneType;
import
net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination;
![]()
![]()
/** */
/**
* @className:PinyingUtil.java
* @classDescription:拼音操作工具类
* @author:xiayingjie
* @createTime:2010-10-21
*/
![]()
![]()
public
class
PinyingUtil
{
![]()
![]()
/** *//**
* 将字符串转换成拼音数组
*
* @param src
* @return
*/
![]()
public static String[] stringToPinyin(String src)
{
return stringToPinyin(src, false, null);
}
![]()
/** *//**
* 将字符串转换成拼音数组
*
* @param src
* @return
*/
![]()
public static String[] stringToPinyin(String src,String separator)
{
return stringToPinyin(src, true, separator);
}
![]()
![]()
/** *//**
* 将字符串转换成拼音数组
*
* @param src
* @param isPolyphone
* 是否查出多音字的所有拼音
* @param separator
* 多音字拼音之间的分隔符
* @return
*/
public static String[] stringToPinyin(String src, boolean isPolyphone,
![]()
String separator)
{
// 判断字符串是否为空
![]()
if ("".equals(src) || null == src)
{
return null;
}
char[] srcChar = src.toCharArray();
int srcCount = srcChar.length;
String[] srcStr = new String[srcCount];
![]()
![]()
for (int i = 0; i < srcCount; i++)
{
srcStr[i] = charToPinyin(srcChar[i], isPolyphone, separator);
}
return srcStr;
}
![]()
![]()
/** *//**
* 将单个字符转换成拼音
*
* @param src
* @return
*/
public static String charToPinyin(char src, boolean isPolyphone,
![]()
String separator)
{
// 创建汉语拼音处理类
HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();
// 输出设置,大小写,音标方式
defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
![]()
StringBuffer tempPinying = new StringBuffer();
![]()
// 如果是中文
![]()
if (src > 128)
{
![]()
try
{
// 转换得出结果
String[] strs = PinyinHelper.toHanyuPinyinStringArray(src,
defaultFormat);
// 是否查出多音字,默认是查出多音字的第一个字符
![]()
if (isPolyphone && null != separator)
{
![]()
for (int i = 0; i < strs.length; i++)
{
tempPinying.append(strs[i]);
![]()
if (strs.length != (i + 1))
{
// 多音字之间用特殊符号间隔起来
tempPinying.append(separator);
}
}
![]()
} else
{
tempPinying.append(strs[0]);
}
![]()
![]()
} catch (BadHanyuPinyinOutputFormatCombination e)
{
e.printStackTrace();
}
![]()
} else
{
tempPinying.append(src);
}
![]()
return tempPinying.toString();
![]()
}
![]()
![]()
public static String hanziToPinyin(String hanzi)
{
return hanziToPinyin(hanzi," ");
}
![]()
/** *//**
* 将汉字转换成拼音
* @param hanzi
* @param separator
* @return
*/
![]()
public static String hanziToPinyin(String hanzi,String separator)
{
// 创建汉语拼音处理类
HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();
// 输出设置,大小写,音标方式
defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
String pinyingStr="";
![]()
try
{
pinyingStr=PinyinHelper.toHanyuPinyinString(hanzi, defaultFormat, separator);
![]()
} catch (BadHanyuPinyinOutputFormatCombination e)
{
// TODO Auto-generated catch block
e.printStackTrace();
}
return pinyingStr;
}
![]()
/** *//**
* 将字符串数组转换成字符串
* @param str
* @param separator 各个字符串之间的分隔符
* @return
*/
![]()
public static String stringArrayToString(String[] str, String separator)
{
StringBuffer sb = new StringBuffer();
![]()
for (int i = 0; i < str.length; i++)
{
sb.append(str[i]);
![]()
if (str.length != (i + 1))
{
sb.append(separator);
}
}
return sb.toString();
}
![]()
/** *//**
* 简单的将各个字符数组之间连接起来
* @param str
* @return
*/
![]()
public static String stringArrayToString(String[] str)
{
return stringArrayToString(str,"");
}
![]()
/** *//**
* 将字符数组转换成字符串
* @param str
* @param separator 各个字符串之间的分隔符
* @return
*/
![]()
public static String charArrayToString(char[] ch, String separator)
{
StringBuffer sb = new StringBuffer();
![]()
for (int i = 0; i < ch.length; i++)
{
sb.append(ch[i]);
![]()
if (ch.length != (i + 1))
{
sb.append(separator);
}
}
return sb.toString();
}
![]()
/** *//**
* 将字符数组转换成字符串
* @param str
* @return
*/
![]()
public static String charArrayToString(char[] ch)
{
return charArrayToString(ch," ");
}
![]()
![]()
/** *//**
* 取汉字的首字母
* @param src
* @param isCapital 是否是大写
* @return
*/
![]()
public static char[] getHeadByChar(char src,boolean isCapital)
{
//如果不是汉字直接返回
![]()
if (src <= 128)
{
![]()
return new char[]
{src};
}
//获取所有的拼音
String []pinyingStr=PinyinHelper.toHanyuPinyinStringArray(src);
//创建返回对象
int polyphoneSize=pinyingStr.length;
char [] headChars=new char[polyphoneSize];
int i=0;
//截取首字符
![]()
for(String s:pinyingStr)
{
char headChar=s.charAt(0);
//首字母是否大写,默认是小写
![]()
if(isCapital)
{
headChars[i]=Character.toUpperCase(headChar);
![]()
}else
{
headChars[i]=headChar;
}
i++;
}
return headChars;
}
![]()
/** *//**
* 取汉字的首字母(默认是大写)
* @param src
* @return
*/
![]()
public static char[] getHeadByChar(char src)
{
return getHeadByChar(src,true);
}
![]()
/** *//**
* 查找字符串首字母
* @param src
* @return
*/
![]()
public static String[] getHeadByString(String src)
{
return getHeadByString( src, true);
}
![]()
/** *//**
* 查找字符串首字母
* @param src
* @param isCapital 是否大写
* @return
*/
![]()
public static String[] getHeadByString(String src,boolean isCapital)
{
return getHeadByString( src, isCapital,null);
}
![]()
/** *//**
* 查找字符串首字母
* @param src
* @param isCapital 是否大写
* @param separator 分隔符
* @return
*/
![]()
public static String[] getHeadByString(String src,boolean isCapital,String separator)
{
char[]chars=src.toCharArray();
String[] headString=new String[chars.length];
int i=0;
![]()
for(char ch:chars)
{
char[]chs=getHeadByChar(ch,isCapital);
StringBuffer sb=new StringBuffer();
![]()
if(null!=separator)
{
int j=1;
![]()
for(char ch1:chs)
{
sb.append(ch1);
![]()
if(j!=chs.length)
{
sb.append(separator);
}
j++;
}
![]()
}else
{
sb.append(chs[0]);
}
headString[i]=sb.toString();
i++;
}
return headString;
}
![]()
public static void main(String[] args)
{
System.out.println(stringArrayToString(getHeadByString("我se 心")));
}
![]()
}
pinyin4j是一个支持将中文转换到拼音的Java开源类库,pinyin4j能够根据中文字符获取其对应的拼音,而且拼音的格式可以定制。pinyin4j的主页:http://pinyin4j.sourceforge.net/
1. 支持简体中文和繁体中文字符;
2. 支持转换到汉语拼音,通用拼音, 威妥玛拼音(威玛拼法), 注音符号第二式, 耶鲁拼法和国语罗马字;
3. 支持多音字,即可以获取一个中文字符的多种发音;
4. 支持多种字符串输出格式,比如支持Unicode格式的字符ü和声调符号(阴平 "ˉ",阳平"ˊ",上声"ˇ",去声"ˋ")的输出。
为了方便大家使用,我将源文件和jar包一并放上来了,欢迎大家下载。
废话少说,下面是我建立的一个通用类,有什么不足的地方希望大家指正。










































