会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
Nice感觉
海绵不断的吸收
博客园
首页
新随笔
联系
订阅
管理
去掉所有HTML标记或取出匹配HTML标记间的文本
正则表达式操作HTML标记
//
取出指定HTML标记中的匹配项的值RegexOptions.IgnoreCase忽略大小写,RegexOptions.Multiline忽略多行显示
Match TitleMatch
=
Regex.Match(
"
<Title>WebForm3</title>
"
,
"
<title>([^<]*)</title>
"
, RegexOptions.IgnoreCase
|
RegexOptions.Multiline );
//
取出第一个匹配项的值
string
tmpStrTitle
=
TitleMatch.Groups[
1
].Value;
//
替换掉HTML页中所有HTML标记
Label1.Text
=
Regex.Replace(Label1.Text.Trim(),
"
<.+?>
"
,
""
)
+
"
*********
"
+
TitleMatch.Groups[
1
].Value;
string
tmpStr
=
string
.Empty;
//
判断匹配正则表达式是否成功
if
(Regex.Match(tmpStr,
"
<.+?>
"
).Success)
{
//
操作
}
posted on
2006-06-26 13:57
Gary.han
阅读(
467
) 评论(
0
)
编辑
收藏
举报
会员力量,点亮园子希望
刷新页面
返回顶部