正则表达式,从富文本中提取纯文本

Java 使用正则表达式,从HTML富文本中提取纯文本。

public class demo {

    /**
     * 富文本提取纯文本
     * @param inputStr
     * @return
     */
    private static String htmlTagFilter(String inputStr) {
        if (inputStr == null || "".equals(inputStr.trim())) {
            return "";
        }
        String outStr = inputStr.replaceAll("\\&[a-zA-Z]{1,10};", "")
                .replaceAll("<[a-zA-Z]+[1-9]?[^><]*>", "")
                .replaceAll("</[a-zA-Z]+[1-9]?>", "")
                .replaceAll("\\s*|\t|\r|\n", "");
        return outStr;
    }

    public static void main(String[] args) {
        System.out.println(
            htmlTagFilter("<p>\n" +
                "\t<span style=\"font-family:&quot;font-size:18px;\">在电影院开展观影活动。</span>\n" +
                "</p>\n" +
                "<p>\n" +
                "\t<span style=\"font-family:&quot;font-size:18px;\"><span style=\"font-family:&quot;font-size:18px;\">在欢乐的气氛中,愉快地度过节日。</span></span>\n" +
                "</p>\n" +
                "<p>\n" +
                "\t<span style=\"font-family:&quot;font-size:18px;\"><img src=\"/admin/kindEditorPath/image/2022-03-02/c3d3e616032d4760b6a5e02fe5c538f6.jpg\" alt=\"\" /><br />\n" +
                "</span>\n" +
                "</p>")
        );
    }

}

输出结果:在电影院开展观影活动。在欢乐的气氛中,愉快地度过节日。

 

心灵笔记:

孩子问我,上班和上学哪一个更辛苦,这让我也不知道该如何回答。

直到我见到一群干着辛苦工作,却有说有笑的人们,我才知道,

不高兴了最辛苦!

posted @ 2022-03-18 14:47  ZZQJWJ  阅读(904)  评论(0编辑  收藏  举报