java 获取页面中的 a 标签 的 href 实例

        Pattern p = Pattern.compile("<a\\s+href\\s*=\\s*(\"|\')?(.*?)[\"|\'|>]", Pattern.CASE_INSENSITIVE);
        Matcher m = p.matcher("<div class=\"related-tags\">\n"
                + "    <span>相关主题推荐:</span>\n"
                + "      <a href=\'http://www.csdn.net/tag/标签\' target=\"_blank\">标签</a>\n"
                + "      <a href=\"http://www.csdn.net/tag/java\" target=\"_blank\">java</a>\n"
                + "      <a href=\"http://www.csdn.net/tag/团购\" target=\"_blank\">团购</a>\n"
                + "      <a href=\"http://www.csdn.net/tag/体育\" target=\"_blank\">体育</a>\n"
                + "      <a href=\"http://www.csdn.net/tag/搜狐\" target=\"_blank\">搜狐</a>\n"
                + "  </div>");
        ArrayList< String> linkList = new ArrayList< String>();
        while (m.find()) {
            String link = m.group(2).trim();
            System.out.println(link);
        }

 

posted @ 2015-03-04 16:27  timelesszhuang  阅读(4849)  评论(0编辑  收藏  举报