Java学习---Pinyin4j使用手册
一般用法
pinyin4j的使用很方便,一般转换只需要使用PinyinHelper类的静态工具方法即可:
String[] pinyin = PinyinHelper.toHanyuPinyinStringArray(‘刘’); //该类还有其他的拼音转换形式,但是基本上用不到,就不介绍了
返回的数组即是该字符的拼音,如上例就是pinyin[0]=liu2,后面的数字代表声调,声调为5表示轻读,无声调。之所谓返回数组,是因为被判定的汉字有可能有多个读音。如果输入的参数不是汉字,则返回null。
拼音格式化
如果对于拼音转换后的结果有一些特定的格式要求目前pinyin4j支持:
l 声调格式化。例如:“刘”字的格式化后为“liu2”或“liu”或“liú”
l 对特殊拼音ü的的显示格式。例如“u:”或“v”或“ü”
l 大小写的转换。例如:“liu2”或“LIU2”
以上这些格式可以混合使用,下面就来介绍具体的使用方法,首先需要创建格式化对象HanyuPinyinOutputFormat,例如:
HanyuPinyinOutputFormat outputFormat = new HanyuPinyinOutputFormat();
然后分别调用outputFormat的set方法设置上述一些格式要求:
设置声调格式:
outputFormat.setToneType(HanyuPinyinToneType);
方法参数HanyuPinyinToneType有以下常量对象:
HanyuPinyinToneType.WITH_TONE_NUMBER 用数字表示声调,例如:liu2
HanyuPinyinToneType.WITHOUT_TONE 无声调表示,例如:liu
HanyuPinyinToneType.WITH_TONE_MARK 用声调符号表示,例如:liú
设置特殊拼音ü的显示格式:
outputFormat.setVCharType(HanyuPinyinVCharType);
方法参数HanyuPinyinVCharType有以下常量对象:
HanyuPinyinVCharType.WITH_U_AND_COLON 以U和一个冒号表示该拼音,例如:lu:
HanyuPinyinVCharType.WITH_V 以V表示该字符,例如:lv
HanyuPinyinVCharType.WITH_U_UNICODE 以ü表示
设置大小写格式
outputFormat.setCaseType(HanyuPinyinCaseType);
HanyuPinyinCaseType.LOWERCASE 转换后以全小写方式输出
HanyuPinyinCaseType.UPPERCASE 转换后以全大写方式输出
设置好格式对象后还是利用上述的工具类方法进行拼音转换,只不过需要将格式化对象当成方法参数传入转换方法,告知要转换的格式要求:
String[] pinyin = PinyinHelper.toHanyuPinyinStringArray(‘刘’, outputFormat);
但该方法会有异常抛出,注意处理。
示例
1 import net.sourceforge.pinyin4j.PinyinHelper; 2 import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType; 3 import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat; 4 import net.sourceforge.pinyin4j.format.HanyuPinyinToneType; 5 import net.sourceforge.pinyin4j.format.HanyuPinyinVCharType; 6 import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination; 7 public class Test { 8 public static void main(String[] args) { 9 import net.sourceforge.pinyin4j.PinyinHelper; 10 import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType; 11 import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat; 12 import net.sourceforge.pinyin4j.format.HanyuPinyinToneType; 13 import net.sourceforge.pinyin4j.format.HanyuPinyinVCharType; 14 import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination; 15 public class Test { 16 public static void main(String[] args) { 17 HanyuPinyinOutputFormat outputFormat = new HanyuPinyinOutputFormat(); 18 outputFormat.setToneType(HanyuPinyinToneType.WITH_TONE_MARK); 19 outputFormat.setVCharType(HanyuPinyinVCharType.WITH_U_UNICODE); 20 outputFormat.setCaseType(HanyuPinyinCaseType.UPPERCASE); 21 try { 22 System.out.println(concatPinyinStringArray(PinyinHelper.toHanyuPinyinStringArray('刘',outputFormat))); 23 } catch (BadHanyuPinyinOutputFormatCombination e) { 24 // TODO Auto-generated catch block 25 e.printStackTrace(); 26 } 27 } 28 29 private static String concatPinyinStringArray(String[] pinyinArray) 30 { 31 StringBuffer pinyinStrBuf = new StringBuffer(); 32 if ((null != pinyinArray) && (pinyinArray.length > 0)) 33 { 34 for (int i = 0; i < pinyinArray.length; i++) 35 { 36 pinyinStrBuf.append(pinyinArray[i]); 37 pinyinStrBuf.append(System.getProperty("line.separator")); 38 } 39 } 40 String outputString = pinyinStrBuf.toString(); 41 return outputString; 42 } 43 } 44 输出结果为:LIÚ
其他
l PinyinHelper还有其他的静态方法,但示例和讲解中使用的方法是常见的拼音格式,因此其他静态方法我没有调研其含义。
l 貌似支持生僻字,我试过很怪异的字,都可以将其读音拼写出来,因此这个工具包还是很强的。
拼音工具
1 package cn.itcast.bos.utils; 2 3 import java.util.Arrays; 4 5 import net.sourceforge.pinyin4j.PinyinHelper; 6 import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType; 7 import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat; 8 import net.sourceforge.pinyin4j.format.HanyuPinyinToneType; 9 import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination; 10 11 public class PinYin4jUtils { 12 /** 13 * 将字符串转换成拼音数组 14 * 15 * @param src 16 * @return 17 */ 18 public static String[] stringToPinyin(String src) { 19 return stringToPinyin(src, false, null); 20 } 21 22 /** 23 * 将字符串转换成拼音数组 24 * 25 * @param src 26 * @return 27 */ 28 public static String[] stringToPinyin(String src, String separator) { 29 30 return stringToPinyin(src, true, separator); 31 } 32 33 /** 34 * 将字符串转换成拼音数组 35 * 36 * @param src 37 * @param isPolyphone 38 * 是否查出多音字的所有拼音 39 * @param separator 40 * 多音字拼音之间的分隔符 41 * @return 42 */ 43 public static String[] stringToPinyin(String src, boolean isPolyphone, 44 String separator) { 45 // 判断字符串是否为空 46 if ("".equals(src) || null == src) { 47 return null; 48 } 49 char[] srcChar = src.toCharArray(); 50 int srcCount = srcChar.length; 51 String[] srcStr = new String[srcCount]; 52 53 for (int i = 0; i < srcCount; i++) { 54 srcStr[i] = charToPinyin(srcChar[i], isPolyphone, separator); 55 } 56 return srcStr; 57 } 58 59 /** 60 * 将单个字符转换成拼音 61 * 62 * @param src 63 * @return 64 */ 65 public static String charToPinyin(char src, boolean isPolyphone, 66 String separator) { 67 // 创建汉语拼音处理类 68 HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat(); 69 // 输出设置,大小写,音标方式 70 defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE); 71 defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE); 72 73 StringBuffer tempPinying = new StringBuffer(); 74 75 // 如果是中文 76 if (src > 128) { 77 try { 78 // 转换得出结果 79 String[] strs = PinyinHelper.toHanyuPinyinStringArray(src, 80 defaultFormat); 81 82 // 是否查出多音字,默认是查出多音字的第一个字符 83 if (isPolyphone && null != separator) { 84 for (int i = 0; i < strs.length; i++) { 85 tempPinying.append(strs[i]); 86 if (strs.length != (i + 1)) { 87 // 多音字之间用特殊符号间隔起来 88 tempPinying.append(separator); 89 } 90 } 91 } else { 92 tempPinying.append(strs[0]); 93 } 94 95 } catch (BadHanyuPinyinOutputFormatCombination e) { 96 e.printStackTrace(); 97 } 98 } else { 99 tempPinying.append(src); 100 } 101 102 return tempPinying.toString(); 103 104 } 105 106 public static String hanziToPinyin(String hanzi) { 107 return hanziToPinyin(hanzi, " "); 108 } 109 110 /** 111 * 将汉字转换成拼音 112 * 113 * @param hanzi 114 * @param separator 115 * @return 116 */ 117 public static String hanziToPinyin(String hanzi, String separator) { 118 119 // 创建汉语拼音处理类 120 HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat(); 121 // 输出设置,大小写,音标方式 122 defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE); 123 defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE); 124 125 String pinyingStr = ""; 126 try { 127 pinyingStr = PinyinHelper.toHanyuPinyinString(hanzi, defaultFormat, 128 separator); 129 } catch (BadHanyuPinyinOutputFormatCombination e) { 130 // TODO Auto-generated catch block 131 e.printStackTrace(); 132 } 133 return pinyingStr; 134 } 135 136 /** 137 * 将字符串数组转换成字符串 138 * 139 * @param str 140 * @param separator 141 * 各个字符串之间的分隔符 142 * @return 143 */ 144 public static String stringArrayToString(String[] str, String separator) { 145 StringBuffer sb = new StringBuffer(); 146 for (int i = 0; i < str.length; i++) { 147 sb.append(str[i]); 148 if (str.length != (i + 1)) { 149 sb.append(separator); 150 } 151 } 152 return sb.toString(); 153 } 154 155 /** 156 * 简单的将各个字符数组之间连接起来 157 * 158 * @param str 159 * @return 160 */ 161 public static String stringArrayToString(String[] str) { 162 return stringArrayToString(str, ""); 163 } 164 165 /** 166 * 将字符数组转换成字符串 167 * 168 * @param str 169 * @param separator 170 * 各个字符串之间的分隔符 171 * @return 172 */ 173 public static String charArrayToString(char[] ch, String separator) { 174 StringBuffer sb = new StringBuffer(); 175 for (int i = 0; i < ch.length; i++) { 176 sb.append(ch[i]); 177 if (ch.length != (i + 1)) { 178 sb.append(separator); 179 } 180 } 181 return sb.toString(); 182 } 183 184 /** 185 * 将字符数组转换成字符串 186 * 187 * @param str 188 * @return 189 */ 190 public static String charArrayToString(char[] ch) { 191 return charArrayToString(ch, " "); 192 } 193 194 /** 195 * 取汉字的首字母 196 * 197 * @param src 198 * @param isCapital 199 * 是否是大写 200 * @return 201 */ 202 public static char[] getHeadByChar(char src, boolean isCapital) { 203 // 如果不是汉字直接返回 204 if (src <= 128) { 205 return new char[] { src }; 206 } 207 // 获取所有的拼音 208 String[] pinyingStr = PinyinHelper.toHanyuPinyinStringArray(src); 209 210 // 创建返回对象 211 int polyphoneSize = pinyingStr.length; 212 char[] headChars = new char[polyphoneSize]; 213 int i = 0; 214 // 截取首字符 215 for (String s : pinyingStr) { 216 char headChar = s.charAt(0); 217 // 首字母是否大写,默认是小写 218 if (isCapital) { 219 headChars[i] = Character.toUpperCase(headChar); 220 } else { 221 headChars[i] = headChar; 222 } 223 i++; 224 } 225 226 return headChars; 227 } 228 229 /** 230 * 取汉字的首字母(默认是大写) 231 * 232 * @param src 233 * @return 234 */ 235 public static char[] getHeadByChar(char src) { 236 return getHeadByChar(src, true); 237 } 238 239 /** 240 * 查找字符串首字母 241 * 242 * @param src 243 * @return 244 */ 245 public static String[] getHeadByString(String src) { 246 return getHeadByString(src, true); 247 } 248 249 /** 250 * 查找字符串首字母 251 * 252 * @param src 253 * @param isCapital 254 * 是否大写 255 * @return 256 */ 257 public static String[] getHeadByString(String src, boolean isCapital) { 258 return getHeadByString(src, isCapital, null); 259 } 260 261 /** 262 * 查找字符串首字母 263 * 264 * @param src 265 * @param isCapital 266 * 是否大写 267 * @param separator 268 * 分隔符 269 * @return 270 */ 271 public static String[] getHeadByString(String src, boolean isCapital, 272 String separator) { 273 char[] chars = src.toCharArray(); 274 String[] headString = new String[chars.length]; 275 int i = 0; 276 for (char ch : chars) { 277 278 char[] chs = getHeadByChar(ch, isCapital); 279 StringBuffer sb = new StringBuffer(); 280 if (null != separator) { 281 int j = 1; 282 283 for (char ch1 : chs) { 284 sb.append(ch1); 285 if (j != chs.length) { 286 sb.append(separator); 287 } 288 j++; 289 } 290 } else { 291 sb.append(chs[0]); 292 } 293 headString[i] = sb.toString(); 294 i++; 295 } 296 return headString; 297 } 298 299 public static void main(String[] args) { 300 // pin4j 简码 和 城市编码 301 String s1 = "中华人民共和国"; 302 String[] headArray = getHeadByString(s1); // 获得每个汉字拼音首字母 303 System.out.println(Arrays.toString(headArray)); 304 305 String s2 ="长城" ; 306 System.out.println(Arrays.toString(stringToPinyin(s2,true,","))); 307 308 String s3 ="长"; 309 System.out.println(Arrays.toString(stringToPinyin(s3,true,","))); 310 } 311 }
-------------------------------------------
个性签名: 所有的事情到最後都是好的,如果不好,那說明事情還沒有到最後~
本文版权归作者【小a玖拾柒】和【博客园】共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利!