正则表达式,从富文本中提取纯文本
Java 使用正则表达式,从HTML富文本中提取纯文本。
public class demo { /** * 富文本提取纯文本 * @param inputStr * @return */ private static String htmlTagFilter(String inputStr) { if (inputStr == null || "".equals(inputStr.trim())) { return ""; } String outStr = inputStr.replaceAll("\\&[a-zA-Z]{1,10};", "") .replaceAll("<[a-zA-Z]+[1-9]?[^><]*>", "") .replaceAll("</[a-zA-Z]+[1-9]?>", "") .replaceAll("\\s*|\t|\r|\n", ""); return outStr; } public static void main(String[] args) { System.out.println( htmlTagFilter("<p>\n" + "\t<span style=\"font-family:"font-size:18px;\">在电影院开展观影活动。</span>\n" + "</p>\n" + "<p>\n" + "\t<span style=\"font-family:"font-size:18px;\"><span style=\"font-family:"font-size:18px;\">在欢乐的气氛中,愉快地度过节日。</span></span>\n" + "</p>\n" + "<p>\n" + "\t<span style=\"font-family:"font-size:18px;\"><img src=\"/admin/kindEditorPath/image/2022-03-02/c3d3e616032d4760b6a5e02fe5c538f6.jpg\" alt=\"\" /><br />\n" + "</span>\n" + "</p>") ); } }
输出结果:在电影院开展观影活动。在欢乐的气氛中,愉快地度过节日。
心灵笔记:
孩子问我,上班和上学哪一个更辛苦,这让我也不知道该如何回答。
直到我见到一群干着辛苦工作,却有说有笑的人们,我才知道,
不高兴了最辛苦!