简单测试--C#实现中文汉字转拼音首字母

第一种:

这个是自己写的比较简单的实现方法,要做汉字转拼音首字母,首先应该有一个存储首字母的数组,然后将要转拼音码的汉字与每个首字母开头的第一个汉字即“最小”的汉字作比较,这里的最小指的是按拼音规则比较最小,例如a比h小,所以“爱”比“恨”小,同一个字母开头的拼音比较大小以此类推。最后实现的结果是只转汉字,对于中文特殊字符、标点符号和英文都原样输出,不转码。

实现方法如下:

 1 using System;
 2 using System.Collections.Generic;
 3 using System.Globalization;
 4 using System.Linq;
 5 using System.Text;
 6 using System.Threading.Tasks;
 7 using System.Text.RegularExpressions;//先导入这个使用正则表达式
 8 
 9 namespace WritePinYin
10 {
11 
12     public class SimplePinYin
13     {
14         //汉字每个首字母的拼音中最小的字,顺序不能乱
15         private static char[] firstcn = { '', '', '', '', '', '', '', '',
16                                    '', '', '', '', '', '', '', '',
17                                    '', '', '', '', '', '', '' };
18         //所有汉字首字母
19         private static char[] firsten = { 'Z', 'Y', 'X', 'W', 'T', 'S', 'R', 'Q',
20                                    'P', 'O', 'N', 'M', 'L', 'K', 'J', 'H',
21                                    'G', 'F', 'E', 'D', 'C', 'B', 'A' };
22 
23         /// <summary> 
24         /// 汉字转化为拼音首字母
25         /// </summary> 
26         /// <param name="str">汉字</param> 
27         /// <returns>首字母</returns> 
28         public static string GetFirstPinyin(string strcn)
29         {
30             int intlen = strcn.Length;
31             int index = 0;
32             char chartemp = char.MinValue;
33             string strtemp = string.Empty;
34             Regex reg = new Regex(@"[\u4e00-\u9fa5]");//\u4e00-\u9fa5用来判断是不是中文的正则表达式
35             CultureInfo pinyin = new CultureInfo(0x804);//保存区域特定的信息,如关联的语言、子语言、国家/地区、日历和区域性约定,这里表示中文
36             if (intlen > 0)
37             {
38                 char[] strchar = new char[intlen + 1];
39                 for (int i = 0; i < intlen; i++)
40                 {
41                     strchar[i] = Convert.ToChar(strcn.Substring(i, 1));
42                 }
43                 foreach (char cstr in strchar)
44                 {
45                     chartemp = char.MinValue;
46                     if (reg.IsMatch(cstr.ToString()))//对于中文汉字,不包括中文特定字符
47                     {
48                         foreach (char fstr in firstcn)
49                         {
50                             if (string.Compare(cstr.ToString(), fstr.ToString(), pinyin, CompareOptions.None) >= 0)//将汉字与设定的汉字按拼音比较大小
51                             {
52                                 index = Array.IndexOf(firstcn, fstr);
53                                 chartemp = firsten[index];
54                                 break;
55                             }
56                         }
57                     }
58                     else//对于非中文汉字,不作拼音码处理
59                     {
60                         chartemp = cstr;
61                     }
62                     strtemp += chartemp;
63                 }
64             }
65             return strtemp;
66         }
67 
68     }
69 }

调用:Console.WriteLine("{0}:{1}", strcn, SimplePinYin.GetFirstPinyin("我是托尔其!"));

第二种:

参考:http://www.cnblogs.com/yazdao/archive/2011/06/04/2072488.html

使用微软的Visual Studio International Pack 类库提取汉字拼音首字母,首先下载Visual Studio International Pack 1.0,官方下载地址:http://www.microsoft.com/downloads/zh-cn/details.aspx?FamilyID=44CAC7F0-633B-477D-AED2-99AEE642FC10&displaylang=zh-cn。下载完毕后解压,解压后可以发现7个MSI安装文件,其中CHSPinYinConv.msi是汉字拼音组件,CHTCHSConv.msi是进行繁简体互转组件,安装这两个MSI就可以了 (x86操作系统上的默认安装目录是 C:\Program Files\Microsoft Visual Studio International Pack\) 。安装完毕后,需要在VS里添加引用,分别引用:C:\Program Files\Microsoft Visual Studio International Pack\Simplified Chinese Pin-Yin Conversion Library(拼音)下和C:\Program Files\Microsoft Visual Studio International Pack\Traditional Chinese to Simplified Chinese Conversion Library and Add-In Tool(繁简互转)下的dll 即可使用。

 1 using Microsoft.International.Converters.PinYinConverter;//导入拼音相关
 2 
 3 namespace WebApplication2
 4 {
 5     public class Class1
 6     {   
 7         /// <summary> 
 8         /// 汉字转化为拼音
 9         /// </summary> 
10         /// <param name="str">汉字</param> 
11         /// <returns>全拼</returns> 
12         public static string GetPinyin(string str)
13         {
14             string r = string.Empty;
15             foreach (char obj in str)
16             {
17                 try
18                 {
19                     ChineseChar chineseChar = new ChineseChar(obj);
20                     string t = chineseChar.Pinyins[0].ToString();
21                     r += t.Substring(0, t.Length - 1);
22                 }
23                 catch
24                 {
25                     r += obj.ToString();
26                 }
27             }
28             return r;
29         }
30 
31         /// <summary> 
32         /// 汉字转化为拼音首字母
33         /// </summary> 
34         /// <param name="str">汉字</param> 
35         /// <returns>首字母</returns> 
36         public static string GetFirstPinyin(string str)
37         {
38             string r = string.Empty;
39             foreach (char obj in str)
40             {
41                 try
42                 {
43                     ChineseChar chineseChar = new ChineseChar(obj);
44                     string t = chineseChar.Pinyins[0].ToString();
45                     r += t.Substring(0, 1);
46                 }
47                 catch
48                 {
49                     r += obj.ToString();
50                 }
51             }
52             return r;
53         }
54     }
55 }

调用:Console.WriteLine("{0}:{1}", strcn, MSPinyin.GetFirstPinyin("我是托尔其!"));

 

posted @ 2017-05-20 15:56  扎尔其  阅读(907)  评论(0编辑  收藏  举报