随笔- 163 文章- 0 评论- 977 阅读- 142万

正则表达式——去除文本中的非汉字（VB2005）

　　本人由于工作关系，需要一段代码，将给定的字符串中的非汉字去除，只保留汉字部分。

　　这个一般用正则表达式比较简单，网上有一些匹配汉字的正则表达式，拿来经过改造就能实现我前面的要求。

　　注释一下，正则表达式[\u4e00-\u9fa5]表示匹配中文，则正则表达式[^\u4e00-\u9fa5]匹配非中文。用Replace方法将匹配的非中文替换为空字符串，也就是去除了文本中的非中文字符。

　　代码格式修正于2012年1月5日

Imports System.Text.RegularExpressions
Public Class clsT
　　Public Function OnlyChinese(ByVal mText As String) As String
　　　　Return Regex.Replace(mText, "[^\u4e00-\u9fa5]", "")
　　End Function
End Class

posted @ 2009-12-11 18:00 万仓一黍阅读(17110) 评论(1) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

阅读排行：
· 阿里巴巴 QwQ-32B真的超越了 DeepSeek R-1吗？
· 【译】Visual Studio 中新的强大生产力特性
· 10年+ .NET Coder 心语 ── 封装的思维：从隐藏、稳定开始理解其本质意义
· 【设计模式】告别冗长if-else语句：使用策略模式优化代码结构
· 字符编码：从基础到乱码解决

公告

昵称：万仓一黍
园龄： 15年5个月
粉丝： 656
关注： 25

+加关注

2009年12月

日

一

二

三

四

五

六

万仓一黍

代码随笔

正则表达式——去除文本中的非汉字（VB2005）

公告

搜索

我的标签

积分与排名

随笔分类 (171)

随笔档案 (163)

阅读排行榜

评论排行榜

推荐排行榜

最新评论