简单测试--C#实现中文汉字转拼音首字母
第一种:
这个是自己写的比较简单的实现方法,要做汉字转拼音首字母,首先应该有一个存储首字母的数组,然后将要转拼音码的汉字与每个首字母开头的第一个汉字即“最小”的汉字作比较,这里的最小指的是按拼音规则比较最小,例如a比h小,所以“爱”比“恨”小,同一个字母开头的拼音比较大小以此类推。最后实现的结果是只转汉字,对于中文特殊字符、标点符号和英文都原样输出,不转码。
实现方法如下:
1 using System; 2 using System.Collections.Generic; 3 using System.Globalization; 4 using System.Linq; 5 using System.Text; 6 using System.Threading.Tasks; 7 using System.Text.RegularExpressions;//先导入这个使用正则表达式 8 9 namespace WritePinYin 10 { 11 12 public class SimplePinYin 13 { 14 //汉字每个首字母的拼音中最小的字,顺序不能乱 15 private static char[] firstcn = { '帀', '丫', '夕', '屲', '他', '仨', '呥', '七', 16 '妑', '噢', '拏', '嘸', '垃', '咔', '丌', '铪', 17 '旮', '发', '妸', '咑', '嚓', '八', '吖' }; 18 //所有汉字首字母 19 private static char[] firsten = { 'Z', 'Y', 'X', 'W', 'T', 'S', 'R', 'Q', 20 'P', 'O', 'N', 'M', 'L', 'K', 'J', 'H', 21 'G', 'F', 'E', 'D', 'C', 'B', 'A' }; 22 23 /// <summary> 24 /// 汉字转化为拼音首字母 25 /// </summary> 26 /// <param name="str">汉字</param> 27 /// <returns>首字母</returns> 28 public static string GetFirstPinyin(string strcn) 29 { 30 int intlen = strcn.Length; 31 int index = 0; 32 char chartemp = char.MinValue; 33 string strtemp = string.Empty; 34 Regex reg = new Regex(@"[\u4e00-\u9fa5]");//\u4e00-\u9fa5用来判断是不是中文的正则表达式 35 CultureInfo pinyin = new CultureInfo(0x804);//保存区域特定的信息,如关联的语言、子语言、国家/地区、日历和区域性约定,这里表示中文 36 if (intlen > 0) 37 { 38 char[] strchar = new char[intlen + 1]; 39 for (int i = 0; i < intlen; i++) 40 { 41 strchar[i] = Convert.ToChar(strcn.Substring(i, 1)); 42 } 43 foreach (char cstr in strchar) 44 { 45 chartemp = char.MinValue; 46 if (reg.IsMatch(cstr.ToString()))//对于中文汉字,不包括中文特定字符 47 { 48 foreach (char fstr in firstcn) 49 { 50 if (string.Compare(cstr.ToString(), fstr.ToString(), pinyin, CompareOptions.None) >= 0)//将汉字与设定的汉字按拼音比较大小 51 { 52 index = Array.IndexOf(firstcn, fstr); 53 chartemp = firsten[index]; 54 break; 55 } 56 } 57 } 58 else//对于非中文汉字,不作拼音码处理 59 { 60 chartemp = cstr; 61 } 62 strtemp += chartemp; 63 } 64 } 65 return strtemp; 66 } 67 68 } 69 }
调用:Console.WriteLine("{0}:{1}", strcn, SimplePinYin.GetFirstPinyin("我是托尔其!"));
第二种:
参考:http://www.cnblogs.com/yazdao/archive/2011/06/04/2072488.html
使用微软的Visual Studio International Pack 类库提取汉字拼音首字母,首先下载Visual Studio International Pack 1.0,官方下载地址:http://www.microsoft.com/downloads/zh-cn/details.aspx?FamilyID=44CAC7F0-633B-477D-AED2-99AEE642FC10&displaylang=zh-cn。下载完毕后解压,解压后可以发现7个MSI安装文件,其中CHSPinYinConv.msi是汉字拼音组件,CHTCHSConv.msi是进行繁简体互转组件,安装这两个MSI就可以了 (x86操作系统上的默认安装目录是 C:\Program Files\Microsoft Visual Studio International Pack\) 。安装完毕后,需要在VS里添加引用,分别引用:C:\Program Files\Microsoft Visual Studio International Pack\Simplified Chinese Pin-Yin Conversion Library(拼音)下和C:\Program Files\Microsoft Visual Studio International Pack\Traditional Chinese to Simplified Chinese Conversion Library and Add-In Tool(繁简互转)下的dll 即可使用。
1 using Microsoft.International.Converters.PinYinConverter;//导入拼音相关 2 3 namespace WebApplication2 4 { 5 public class Class1 6 { 7 /// <summary> 8 /// 汉字转化为拼音 9 /// </summary> 10 /// <param name="str">汉字</param> 11 /// <returns>全拼</returns> 12 public static string GetPinyin(string str) 13 { 14 string r = string.Empty; 15 foreach (char obj in str) 16 { 17 try 18 { 19 ChineseChar chineseChar = new ChineseChar(obj); 20 string t = chineseChar.Pinyins[0].ToString(); 21 r += t.Substring(0, t.Length - 1); 22 } 23 catch 24 { 25 r += obj.ToString(); 26 } 27 } 28 return r; 29 } 30 31 /// <summary> 32 /// 汉字转化为拼音首字母 33 /// </summary> 34 /// <param name="str">汉字</param> 35 /// <returns>首字母</returns> 36 public static string GetFirstPinyin(string str) 37 { 38 string r = string.Empty; 39 foreach (char obj in str) 40 { 41 try 42 { 43 ChineseChar chineseChar = new ChineseChar(obj); 44 string t = chineseChar.Pinyins[0].ToString(); 45 r += t.Substring(0, 1); 46 } 47 catch 48 { 49 r += obj.ToString(); 50 } 51 } 52 return r; 53 } 54 } 55 }
调用:Console.WriteLine("{0}:{1}", strcn, MSPinyin.GetFirstPinyin("我是托尔其!"));