C# 去除HTML标签
在做网站的时候,用到了去除html标签的问题,用正则匹配到html标签,然后replace即可。
/// <summary>
/// C#去除HTML标签
/// </summary>
/// <param name="html">带有html标签的文本</param>
/// <param name="length">截取长度</param>
/// <returns></returns>
public static string ReplaceHtmlTag(string html, int length = 0)
{
string strText = System.Text.RegularExpressions.Regex.Replace(html, "<[^>]+>", "");
strText = System.Text.RegularExpressions.Regex.Replace(strText, "&[^;]+;", "");
if (length > 0 && strText.Length > length)
return strText.Substring(0, length);
return strText;
}
这个方法可以实现去除html标签的功能。
Length参数可以根据传入值取固定长度的值。用于生成文章摘要比较方便。