1, ^[a-z][\s\S]*\.html$ :以小写字母开头的,以 .html 结尾的字符,筛选 exaple.html 这样的网页
扩展的:^[[:blank:]]*[a-z].*\.html[[:blank:]]
^[a-z].*\.[Hh][Tt][Mm][Ll]$
2, <\/[Pp][Rr][Ee]>[\s]*?<[Pp]> :以</per>开始,以<p>结尾的标签,大小写都可以,中间是任意多个空格和换行
3, <\/[Pp][Rr][Ee]>[\s\S]*?<[Pp]> :同上,只是中间可以任意字符串