正则匹配拼音
把可能的列出来就可以了,因此正则表达式这样写:
[āáǎàēéěèīíǐìōóǒòūúǔùǖǘǚǜüêɑńňɡa-zA-ZA-Za-z\\s∥-]+
在c#中,可以这样
var pyregx = new Regex("(?<pingying>[āáǎàēéěèīíǐìōóǒòūúǔùǖǘǚǜüêɑńňɡa-zA-ZA-Za-z\\s∥-]+)");
var data = pyregx.Match(“chāngzú 名 我国少数民族之一,分布在云南");
var pingying = data.Groups["pingying"].Value; // chāngzú