1      String str="<li>申办</li><li class=\"arrow\"></li><li>受理</li><li class=\"arrow\"></li><li class=\"cb\"><h2 id=\"chengban\" class=\"ready\">承办</h2><ul><li class=\"arrow-left\"></li><li id=\"tebie\" >特别程序</li><li class=\"arrow-right\"></li></ul></li><li class=\"arrow\"></li><li>初审</li><li class=\"arrow\"></li><li>复审</li><li class=\"arrow\"></li><li>决定</li><li class=\"arrow\"></li><li>文书整理</li><li class=\"arrow\"></li><li>制证</li><li class=\"arrow\"></li><li>送达</li><li class=\"arrow\"></li><li>归档</li><li class=\"arrow\"></li><li>办结</li>";
2         Pattern p = Pattern.compile("([\\u4e00-\\u9fa5]+)");
3         Matcher matcher = p.matcher(str);
4         while(matcher.find()) {
5             System.out.print(matcher.group()+"\t");;
6         }
      输出结果:申办 受理 承办 特别程序 初审 复审 决定 文书整理 制证 送达 归档 办结