汉字的相关处理

1.去除字符中,汉字的空格

target = Regex.Replace(target, "([\u4E00-\u9FA5]+)((\\s)+)", "$1");//去除汉字中的空格

2.繁体汉字与简体汉字的转换操作

  引用ChineseConverter.dll  

ChineseConverter.Convert(CompanyCNName, ChineseConversionDirection.TraditionalToSimplified);

3.汉字处理相关dll

  Stanford CoreNLP

  相关link:

  https://sergey-tihon.github.io/Stanford.NLP.NET/

  https://nlp.stanford.edu/software/stanford-dependencies.shtml

 

posted @ 2017-08-21 15:09  PanPan003  阅读(179)  评论(0编辑  收藏  举报