正则匹配html标签以及内容
-
匹配所有标签
</?[a-zA-Z! ="-\d]*>
-
匹配闭合标签以及里面内容
<[a-zA-Z! ="-\d]*>[^</>]*</[a-zA-Z! ="-\d]*>
java使用要对-
进行转义:
</?[a-zA-Z! ="\-\d]*>
<[a-zA-Z! ="\-\d]*>[^</>]*</[a-zA-Z! ="\-\d]*>
copy/**
* @author linyufeng.
* @date 2021/2/3 13:34
**/
public class TextUtil {
// 去除html标签
public static String disHtml(String str) {
return str.replaceAll("</?[a-zA-Z! =\"\\-\\d]*>", "");
}
// 去除html标签以及里面内容
public static String disAllHtml(String str) {
return str.replaceAll("<[a-zA-Z! =\"\\-\\d]*>[^</>]*</[a-zA-Z! =\"\\-\\d]*>", "");
}
}
((?!abc).)*
否定向前语法, 可以帮助我们去除指定前缀的字符串;[^abc]
范围比较大,不能起到只过滤abc
的目的;
所以,上述优化格式为: <[a-zA-Z! ="\-\d]*>((?!</).)*</[a-zA-Z! ="\-\d]*>
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步