Remove all the html Tag in String
在用Umbraco开发项目的过程中,由于在Umbraco Back office 中有用到 rich text editor, 而它返回的值是HtmlString类型,也就是说是包含Html Tag的
比如 返回的是 "<p><span>This is a test message</span></p>"
那么,如何来移除掉其中的html tag呢.
我们可以用正则表达式来移除掉其中的html tag
@using System.Text; @using System.Web; public static class StringTool { private static readonly Regex HtmlTag = new Regex(@"<[^>]*>"); public static string RemoveHtmlTag(this string origStr) { return string.IsNullOrEmpty(origStr) ? origStr : HttpUtility.HtmlDecode(HtmlTag.Replace(origStr, string.Empty)); } }
上面,我们写了一个扩展方法 RemoveHtmlTag 来移除string中的html tag, 采用了正则表达式HtmlTag