Java学习---Pinyin4j使用手册

一般用法

pinyin4j的使用很方便,一般转换只需要使用PinyinHelper类的静态工具方法即可:

String[] pinyin = PinyinHelper.toHanyuPinyinStringArray(‘刘’);
//该类还有其他的拼音转换形式,但是基本上用不到,就不介绍了

返回的数组即是该字符的拼音,如上例就是pinyin[0]=liu2,后面的数字代表声调,声调为5表示轻读,无声调。之所谓返回数组,是因为被判定的汉字有可能有多个读音。如果输入的参数不是汉字,则返回null。

拼音格式化

如果对于拼音转换后的结果有一些特定的格式要求目前pinyin4j支持:

l 声调格式化。例如:“刘”字的格式化后为“liu2”或“liu”或“liú”

l 对特殊拼音ü的的显示格式。例如“u:”或“v”或“ü”

l 大小写的转换。例如:“liu2”或“LIU2”

以上这些格式可以混合使用,下面就来介绍具体的使用方法,首先需要创建格式化对象HanyuPinyinOutputFormat,例如:

HanyuPinyinOutputFormat outputFormat = new HanyuPinyinOutputFormat();

然后分别调用outputFormat的set方法设置上述一些格式要求:

设置声调格式:

outputFormat.setToneType(HanyuPinyinToneType);

方法参数HanyuPinyinToneType有以下常量对象:

HanyuPinyinToneType.WITH_TONE_NUMBER 用数字表示声调,例如:liu2

HanyuPinyinToneType.WITHOUT_TONE 无声调表示,例如:liu

HanyuPinyinToneType.WITH_TONE_MARK 用声调符号表示,例如:liú

设置特殊拼音ü的显示格式:

outputFormat.setVCharType(HanyuPinyinVCharType);

方法参数HanyuPinyinVCharType有以下常量对象:

HanyuPinyinVCharType.WITH_U_AND_COLON 以U和一个冒号表示该拼音,例如:lu:

HanyuPinyinVCharType.WITH_V 以V表示该字符,例如:lv

HanyuPinyinVCharType.WITH_U_UNICODE 以ü表示

设置大小写格式

outputFormat.setCaseType(HanyuPinyinCaseType);

HanyuPinyinCaseType.LOWERCASE 转换后以全小写方式输出

HanyuPinyinCaseType.UPPERCASE 转换后以全大写方式输出

设置好格式对象后还是利用上述的工具类方法进行拼音转换,只不过需要将格式化对象当成方法参数传入转换方法,告知要转换的格式要求:

String[] pinyin = PinyinHelper.toHanyuPinyinStringArray(‘刘’, outputFormat);

但该方法会有异常抛出,注意处理。

示例

 1 import net.sourceforge.pinyin4j.PinyinHelper;
 2 import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;
 3 import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;
 4 import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;
 5 import net.sourceforge.pinyin4j.format.HanyuPinyinVCharType;
 6 import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination;
 7 public class Test {
 8     public static void main(String[] args) {
 9 import net.sourceforge.pinyin4j.PinyinHelper;
10 import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;
11 import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;
12 import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;
13 import net.sourceforge.pinyin4j.format.HanyuPinyinVCharType;
14 import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination;
15 public class Test {
16     public static void main(String[] args) {
17         HanyuPinyinOutputFormat outputFormat = new HanyuPinyinOutputFormat();
18         outputFormat.setToneType(HanyuPinyinToneType.WITH_TONE_MARK);
19         outputFormat.setVCharType(HanyuPinyinVCharType.WITH_U_UNICODE);
20         outputFormat.setCaseType(HanyuPinyinCaseType.UPPERCASE);
21         try {
22             System.out.println(concatPinyinStringArray(PinyinHelper.toHanyuPinyinStringArray('刘',outputFormat)));
23         } catch (BadHanyuPinyinOutputFormatCombination e) {
24             // TODO Auto-generated catch block
25             e.printStackTrace();
26         }
27     }
28     
29     private static String concatPinyinStringArray(String[] pinyinArray)
30     {
31         StringBuffer pinyinStrBuf = new StringBuffer();
32         if ((null != pinyinArray) && (pinyinArray.length > 0))
33         {
34             for (int i = 0; i < pinyinArray.length; i++)
35             {
36                 pinyinStrBuf.append(pinyinArray[i]);
37                 pinyinStrBuf.append(System.getProperty("line.separator"));
38             }
39         }
40         String outputString = pinyinStrBuf.toString();
41         return outputString;
42     }
43 }
44 输出结果为:LIÚ
View Code

其他

l PinyinHelper还有其他的静态方法,但示例和讲解中使用的方法是常见的拼音格式,因此其他静态方法我没有调研其含义。

l 貌似支持生僻字,我试过很怪异的字,都可以将其读音拼写出来,因此这个工具包还是很强的。

拼音工具

  1 package cn.itcast.bos.utils;
  2 
  3 import java.util.Arrays;
  4 
  5 import net.sourceforge.pinyin4j.PinyinHelper;
  6 import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;
  7 import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;
  8 import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;
  9 import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination;
 10 
 11 public class PinYin4jUtils {
 12     /**
 13      * 将字符串转换成拼音数组
 14      * 
 15      * @param src
 16      * @return
 17      */
 18     public static String[] stringToPinyin(String src) {
 19         return stringToPinyin(src, false, null);
 20     }
 21 
 22     /**
 23      * 将字符串转换成拼音数组
 24      * 
 25      * @param src
 26      * @return
 27      */
 28     public static String[] stringToPinyin(String src, String separator) {
 29 
 30         return stringToPinyin(src, true, separator);
 31     }
 32 
 33     /**
 34      * 将字符串转换成拼音数组
 35      * 
 36      * @param src
 37      * @param isPolyphone
 38      *            是否查出多音字的所有拼音
 39      * @param separator
 40      *            多音字拼音之间的分隔符
 41      * @return
 42      */
 43     public static String[] stringToPinyin(String src, boolean isPolyphone,
 44             String separator) {
 45         // 判断字符串是否为空
 46         if ("".equals(src) || null == src) {
 47             return null;
 48         }
 49         char[] srcChar = src.toCharArray();
 50         int srcCount = srcChar.length;
 51         String[] srcStr = new String[srcCount];
 52 
 53         for (int i = 0; i < srcCount; i++) {
 54             srcStr[i] = charToPinyin(srcChar[i], isPolyphone, separator);
 55         }
 56         return srcStr;
 57     }
 58 
 59     /**
 60      * 将单个字符转换成拼音
 61      * 
 62      * @param src
 63      * @return
 64      */
 65     public static String charToPinyin(char src, boolean isPolyphone,
 66             String separator) {
 67         // 创建汉语拼音处理类
 68         HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();
 69         // 输出设置,大小写,音标方式
 70         defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
 71         defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
 72 
 73         StringBuffer tempPinying = new StringBuffer();
 74 
 75         // 如果是中文
 76         if (src > 128) {
 77             try {
 78                 // 转换得出结果
 79                 String[] strs = PinyinHelper.toHanyuPinyinStringArray(src,
 80                         defaultFormat);
 81 
 82                 // 是否查出多音字,默认是查出多音字的第一个字符
 83                 if (isPolyphone && null != separator) {
 84                     for (int i = 0; i < strs.length; i++) {
 85                         tempPinying.append(strs[i]);
 86                         if (strs.length != (i + 1)) {
 87                             // 多音字之间用特殊符号间隔起来
 88                             tempPinying.append(separator);
 89                         }
 90                     }
 91                 } else {
 92                     tempPinying.append(strs[0]);
 93                 }
 94 
 95             } catch (BadHanyuPinyinOutputFormatCombination e) {
 96                 e.printStackTrace();
 97             }
 98         } else {
 99             tempPinying.append(src);
100         }
101 
102         return tempPinying.toString();
103 
104     }
105 
106     public static String hanziToPinyin(String hanzi) {
107         return hanziToPinyin(hanzi, " ");
108     }
109 
110     /**
111      * 将汉字转换成拼音
112      * 
113      * @param hanzi
114      * @param separator
115      * @return
116      */
117     public static String hanziToPinyin(String hanzi, String separator) {
118 
119         // 创建汉语拼音处理类
120         HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();
121         // 输出设置,大小写,音标方式
122         defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
123         defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
124 
125         String pinyingStr = "";
126         try {
127             pinyingStr = PinyinHelper.toHanyuPinyinString(hanzi, defaultFormat,
128                     separator);
129         } catch (BadHanyuPinyinOutputFormatCombination e) {
130             // TODO Auto-generated catch block
131             e.printStackTrace();
132         }
133         return pinyingStr;
134     }
135 
136     /**
137      * 将字符串数组转换成字符串
138      * 
139      * @param str
140      * @param separator
141      *            各个字符串之间的分隔符
142      * @return
143      */
144     public static String stringArrayToString(String[] str, String separator) {
145         StringBuffer sb = new StringBuffer();
146         for (int i = 0; i < str.length; i++) {
147             sb.append(str[i]);
148             if (str.length != (i + 1)) {
149                 sb.append(separator);
150             }
151         }
152         return sb.toString();
153     }
154 
155     /**
156      * 简单的将各个字符数组之间连接起来
157      * 
158      * @param str
159      * @return
160      */
161     public static String stringArrayToString(String[] str) {
162         return stringArrayToString(str, "");
163     }
164 
165     /**
166      * 将字符数组转换成字符串
167      * 
168      * @param str
169      * @param separator
170      *            各个字符串之间的分隔符
171      * @return
172      */
173     public static String charArrayToString(char[] ch, String separator) {
174         StringBuffer sb = new StringBuffer();
175         for (int i = 0; i < ch.length; i++) {
176             sb.append(ch[i]);
177             if (ch.length != (i + 1)) {
178                 sb.append(separator);
179             }
180         }
181         return sb.toString();
182     }
183 
184     /**
185      * 将字符数组转换成字符串
186      * 
187      * @param str
188      * @return
189      */
190     public static String charArrayToString(char[] ch) {
191         return charArrayToString(ch, " ");
192     }
193 
194     /**
195      * 取汉字的首字母
196      * 
197      * @param src
198      * @param isCapital
199      *            是否是大写
200      * @return
201      */
202     public static char[] getHeadByChar(char src, boolean isCapital) {
203         // 如果不是汉字直接返回
204         if (src <= 128) {
205             return new char[] { src };
206         }
207         // 获取所有的拼音
208         String[] pinyingStr = PinyinHelper.toHanyuPinyinStringArray(src);
209 
210         // 创建返回对象
211         int polyphoneSize = pinyingStr.length;
212         char[] headChars = new char[polyphoneSize];
213         int i = 0;
214         // 截取首字符
215         for (String s : pinyingStr) {
216             char headChar = s.charAt(0);
217             // 首字母是否大写,默认是小写
218             if (isCapital) {
219                 headChars[i] = Character.toUpperCase(headChar);
220             } else {
221                 headChars[i] = headChar;
222             }
223             i++;
224         }
225 
226         return headChars;
227     }
228 
229     /**
230      * 取汉字的首字母(默认是大写)
231      * 
232      * @param src
233      * @return
234      */
235     public static char[] getHeadByChar(char src) {
236         return getHeadByChar(src, true);
237     }
238 
239     /**
240      * 查找字符串首字母
241      * 
242      * @param src
243      * @return
244      */
245     public static String[] getHeadByString(String src) {
246         return getHeadByString(src, true);
247     }
248 
249     /**
250      * 查找字符串首字母
251      * 
252      * @param src
253      * @param isCapital
254      *            是否大写
255      * @return
256      */
257     public static String[] getHeadByString(String src, boolean isCapital) {
258         return getHeadByString(src, isCapital, null);
259     }
260 
261     /**
262      * 查找字符串首字母
263      * 
264      * @param src
265      * @param isCapital
266      *            是否大写
267      * @param separator
268      *            分隔符
269      * @return
270      */
271     public static String[] getHeadByString(String src, boolean isCapital,
272             String separator) {
273         char[] chars = src.toCharArray();
274         String[] headString = new String[chars.length];
275         int i = 0;
276         for (char ch : chars) {
277 
278             char[] chs = getHeadByChar(ch, isCapital);
279             StringBuffer sb = new StringBuffer();
280             if (null != separator) {
281                 int j = 1;
282 
283                 for (char ch1 : chs) {
284                     sb.append(ch1);
285                     if (j != chs.length) {
286                         sb.append(separator);
287                     }
288                     j++;
289                 }
290             } else {
291                 sb.append(chs[0]);
292             }
293             headString[i] = sb.toString();
294             i++;
295         }
296         return headString;
297     }
298     
299     public static void main(String[] args) {
300         // pin4j 简码 和 城市编码 
301         String s1 = "中华人民共和国"; 
302         String[] headArray = getHeadByString(s1); // 获得每个汉字拼音首字母
303         System.out.println(Arrays.toString(headArray));
304         
305         String s2 ="长城" ; 
306         System.out.println(Arrays.toString(stringToPinyin(s2,true,",")));
307         
308         String s3 ="长";
309         System.out.println(Arrays.toString(stringToPinyin(s3,true,",")));
310     }
311 }
View Code

 

 
posted @ 2018-07-23 22:41  小a玖拾柒  阅读(8449)  评论(0编辑  收藏  举报