使用正则表达式去除html标签
不知道大家遇到这话总情况没有,从数据库读取数据,数据参杂着html标记<p>等,在显式的时候控制字符个数,这个时候就会出现页面样式串行,使用正则表达式去除html标记就不会有还这个问题.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 | /// <summary> /// 去除HTML标记 /// </summary> /// <param name="NoHTML">包括HTML的源码 </param> /// <returns>已经去除后的文字</returns> public static string NoHTML(string Htmlstring) { //删除脚本 Htmlstring = Regex.Replace(Htmlstring, @ "<script[^>]*?>.*?</script>" , "" , RegexOptions.IgnoreCase); //删除HTML Htmlstring = Regex.Replace(Htmlstring, @ "<(.[^>]*)>" , "" , RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @ "([\r\n])[\s]+" , "" , RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @ "-->" , "" , RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @ "<!--.*" , "" , RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @ "&(quot|#34);" , "\"" , RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @ "&(amp|#38);" , "&" , RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @ "&(lt|#60);" , "<" , RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @ "&(gt|#62);" , ">" , RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @ "&(nbsp|#160);" , " " , RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @ "&(iexcl|#161);" , "\xa1" , RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @ "&(cent|#162);" , "\xa2" , RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @ "&(pound|#163);" , "\xa3" , RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @ "&(copy|#169);" , "\xa9" , RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @ "&#(\d+);" , "" , RegexOptions.IgnoreCase); Htmlstring.Replace( "<" , "" ); Htmlstring.Replace( ">" , "" ); Htmlstring.Replace( "\r\n" , "" ); Htmlstring = HttpContext.Current.Server.HtmlEncode(Htmlstring).Trim(); return Htmlstring; } |
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· 阿里巴巴 QwQ-32B真的超越了 DeepSeek R-1吗?
· 【译】Visual Studio 中新的强大生产力特性
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 【设计模式】告别冗长if-else语句:使用策略模式优化代码结构